Programa do Curso

Divisão de tópicos diariamente: (Cada sessão dura 2 horas)

Dia 1: Sessão -1: Business Visão geral do porquê Big Data Business Inteligência em telecomunicações.

  • Estudos de caso da T-Mobile, Verizon etc.
  • Big Data taxa de adaptação nas empresas de telecomunicações norte-americanas e como elas estão alinhando seu futuro modelo de negócios e operação em torno de Big Data BI
  • Área de aplicação em larga escala
  • Gerenciamento de rede e serviços
  • Rotatividade de clientes Management
  • Data Integration e visualização do painel
  • Gestão de fraude
  • Business Geração de regras
  • Perfil do cliente
  • Envio de anúncios localizados

Dia 1: Sessão 2: Introdução de Big Data-1

  • Principais características de Big Data-volume, variedade, velocidade e veracidade. Arquitetura MPP para volume.
  • Data Warehouses – esquema estático, conjunto de dados em evolução lenta
  • MPP Database como Greenplum, Exadata, Teradata, Netezza, Vertica etc.
  • Hadoop Soluções Baseadas – sem condições na estrutura do conjunto de dados.
  • Padrão típico: HDFS, MapReduce (crunch), recuperação do HDFS
  • Lote adequado para análises/não interativas
  • Volume: dados de streaming CEP
  • Escolhas típicas – produtos CEP (por exemplo, Infostreams, Apama, MarkLogic etc.)
  • Menos produção pronta – Storm/S4
  • NoSQL Databases – (colunar e valor-chave): Mais adequado como complemento analítico para data warehouse/banco de dados

Dia 1: Sessão -3: Introdução a Big Data-2

NoSQL soluções

  • Armazenamento KV - Keyspace, Flare, SchemaFree, RAMCloud, Oracle NoSQL Database (OnDB)
  • Loja KV - Dynamo, Voldemort, Dynomite, SubRecord, Mo8onDb, DovetailDB
  • Loja KV (hierárquica) - GT.m, Cache
  • Loja KV (encomendada) - TokyoTyrant, Lightcloud, NMDB, Luxio, MemcacheDB, Accord
  • Cache KV - Memcached, Repcached, Coerência, Infinispan, EXtremeScale, JBossCache, Velocidade, Terracoqua
  • Loja Tupla - Gigaspaces, Coord, Rio Apache
  • Objeto Database - ZopeDB, DB40, Shoal
  • Armazenamento de documentos - CouchDB, Cloudant, Couchbase, MongoDB, Jackrabbit, XML-Databases, ThruDB, CloudKit, Prsevere, Riak-Basho, Scalaris
  • Amplo armazenamento colunar - BigTable, HBase, Apache Cassandra, Hypertable, KAI, OpenNeptune, Qbase, KDI

Variedades de dados: introdução ao problema Data Cleaning em Big Data

  • RDBMS – estrutura/esquema estático, não promove ambiente ágil e exploratório.
  • NoSQL – estrutura semiestruturada, suficiente para armazenar dados sem esquema exato antes de armazenar os dados
  • Problemas de limpeza de dados

Dia 1: Sessão 4: Big Data Introdução-3: Hadoop

  • Quando selecionar Hadoop?
  • ESTRUTURADO - Data warehouses/bancos de dados corporativos podem armazenar dados massivos (a um custo), mas impor estrutura (não é bom para exploração ativa)
  • Dados SEMI ESTRUTURADOS – difíceis de fazer com soluções tradicionais (DW/DB)
  • Dados de armazenamento = ENORME esforço e estática mesmo após a implementação
  • Para variedade e volume de dados, processados em hardware comum – HADOOP
  • H/W de commodities necessário para criar um Hadoop Cluster

Introdução à redução de mapa/HDFS

  • MapReduce – distribua computação em vários servidores
  • HDFS – disponibiliza dados localmente para o processo de computação (com redundância)
  • Dados – podem ser não estruturados/sem esquema (ao contrário do RDBMS)
  • Responsabilidade do desenvolvedor em dar sentido aos dados
  • Programming MapReduce = trabalhando com Java (prós/contras), carregando dados manualmente no HDFS

Dia 2: Sessão 1.1: Spark: banco de dados distribuído na memória

  • O que é processamento “na memória”?
  • Faísca SQL
  • Faísca SDK
  • API Spark
  • RDD
  • Faísca Lib
  • Hanna
  • Como migrar um sistema Hadoop existente para Spark

Sessão do dia 2 -1.2: Tempestade - Processamento em tempo real em Big Data

  • Fluxos
  • Brotos
  • Parafusos
  • Topologias

Dia 2: Sessão 2: Big Data Management Sistema

  • Partes móveis, nós de computação iniciam/falham: ZooKeeper - Para serviços de configuração/coordenação/nomeação
  • Pipeline/fluxo de trabalho complexo: Oozie – gerencie fluxo de trabalho, dependências, ligação em série
  • Implantar, configurar, gerenciamento de cluster, atualizar etc (administrador de sistema): Ambari
  • Na nuvem: Whirr
  • Evolução de Big Data ferramentas de plataforma para rastreamento
  • Problemas de aplicação da camada ETL

Dia 2: Sessão 3: Análise preditiva em Business Inteligência -1: Técnicas fundamentais e BI baseado em aprendizado de máquina:

  • Introdução ao aprendizado de máquina
  • Aprendendo técnicas de classificação
  • Arquivo de treinamento de preparação de previsão bayesiana
  • Campo aleatório de Markov
  • Aprendizagem supervisionada e não supervisionada
  • Extração de recursos
  • Máquina de vetores de suporte
  • Rede neural
  • Aprendizagem por reforço
  • Big Data problema de grande variável -Floresta aleatória (RF)
  • Aprendizagem de representação
  • Aprendizado profundo
  • Big Data Problema de automação – conjunto multimodelo RF
  • Automação através do Soft10-M
  • LDA e modelagem de tópicos
  • Agile aprendendo
  • Aprendizagem baseada em agente - Exemplo de operação de telecomunicações
  • Aprendizagem distribuída – Exemplo de operação de telecomunicações
  • Introdução às ferramentas de código aberto para análise preditiva: R, Rapidminer, Mahut
  • Laboratório Analítico-Apache Hama, Spark e CMU Graph mais escalável

Dia 2: Sessão 4 Ecossistema de análise preditiva-2: Problemas comuns de análise preditiva em Telecom

  • Análise de insights
  • Análise de visualização
  • Análise preditiva estruturada
  • Análise preditiva não estruturada
  • Perfil do cliente
  • Mecanismo de recomendação
  • Detecção de padrões
  • Descoberta de regras/cenários – falha, fraude, otimização
  • Descoberta da causa raiz
  • Análise de sentimentos
  • Análise de CRM
  • Análise de rede
  • Análise de texto
  • Revisão assistida por tecnologia
  • Análise de fraude
  • Análise em tempo real

Dia 3: Sessão 1: Análise de operação de rede - análise de causa raiz de falhas de rede, interrupção de serviço de metadados, IPDR e CRM:

  • Utilização do CPU
  • Uso de memória
  • Uso da fila de QoS
  • Temperatura do dispositivo
  • Erro de interface
  • Versões iOS
  • Eventos de roteamento
  • Variações de latência
  • Análise de syslog
  • Perda de pacotes
  • Simulação de carga
  • Inferência de topologia
  • Limite de desempenho
  • Armadilhas de dispositivos
  • Coleta e processamento de IPDR (registro detalhado de IP)
  • Uso de dados IPDR para consumo de largura de banda do assinante, utilização da interface de rede, status do modem e diagnóstico
  • Informações sobre HFC

Dia 3: Sessão 2: Ferramentas para análise de falhas de serviço de rede:

  • Painel de resumo da rede: monitore implantações gerais de rede e acompanhe os principais indicadores de desempenho da sua organização
  • Painel de análise de período de pico: entenda as tendências de aplicativos e assinantes que impulsionam a utilização de pico, com granularidade específica do local
  • Painel de eficiência de roteamento: controle os custos da rede e crie casos de negócios para projetos de capital com um entendimento completo das relações de interconexão e trânsito
  • Painel de entretenimento em tempo real: acesse métricas importantes, incluindo visualizações de vídeo, duração e qualidade da experiência de vídeo (QoE)
  • Painel de transição IPv6: investigue a adoção contínua do IPv6 em sua rede e obtenha insights sobre os aplicativos e dispositivos que impulsionam as tendências
  • Estudo de caso 1: O minerador de dados Alcatel-Lucent Big Network Analytics (BNA)
  • Inteligência móvel multidimensional (m.IQ6)

Dia 3: Sessão 3: Big Data BI para Marketing/Vendas – Compreendendo vendas/marketing a partir de dados de vendas: (todos eles serão mostrados com uma demonstração de análise preditiva ao vivo)

  • Para identificar clientes de maior velocidade
  • Para identificar clientes para um determinado produto
  • Para identificar o conjunto certo de produtos para um cliente (mecanismo de recomendação)
  • Técnica de segmentação de mercado
  • Técnica de venda cruzada e upsale
  • Técnica de segmentação de clientes
  • Técnica de previsão de receita de vendas

Dia 3: Sessão 4: BI necessário para o escritório CFO da Telco:

  • Visão geral de Business trabalhos analíticos necessários em um escritório de CFO
  • Análise de risco em novos investimentos
  • Receita, previsão de lucro
  • Previsão de aquisição de novos clientes
  • Previsão de perdas
  • Análise de fraude em finanças (detalhes na próxima sessão)

Dia 4: Sessão 1: BI de prevenção de fraude de Big Data na análise de Telco-Fraud:

  • Vazamento de largura de banda/fraude de largura de banda
  • Fraude de fornecedor/cobrança excessiva de projetos
  • Fraudes de reembolso/reclamações de clientes
  • Fraudes de reembolso de viagens

Dia 4: Sessão 2: Da previsão de rotatividade à prevenção de rotatividade:

  • 3 tipos de rotatividade: ativa/deliberada, rotacional/incidental, passiva involuntária
  • 3 classificação de clientes cancelados: Total, Oculto, Parcial
  • Compreendendo as variáveis de CRM para rotatividade
  • Coleta de dados de comportamento do cliente
  • Coleta de dados de percepção do cliente
  • Coleta de dados demográficos do cliente
  • Limpeza de dados de CRM
  • Dados não estruturados de CRM (chamadas de clientes, tickets, e-mails) e sua conversão em dados estruturados para análise de Churn
  • Social Media Nova forma de CRM para extrair índice de satisfação do cliente
  • Estudo de caso 1: T-Mobile USA: redução de rotatividade em 50%

Dia 4: Sessão 3: Como usar a análise preditiva para análise de causa raiz da insatisfação do cliente:

  • Estudo de caso -1: Vinculando a insatisfação a problemas – Falhas de contabilidade, engenharia, como interrupção de serviço, serviço de largura de banda ruim
  • Estudo de caso-2: Big Data Painel de controle de qualidade para rastrear o índice de satisfação do cliente a partir de vários parâmetros, como escalonamento de chamadas, criticidade de problemas, eventos pendentes de interrupção de serviço, etc.

Dia 4: Sessão 4: Big Data Painel para acessibilidade rápida de diversos dados e exibição:

  • Integração da plataforma de aplicativos existente com Big Data Dashboard
  • Big Data gestão
  • Estudo de caso do Big Data Painel: Tableau e Pentaho
  • Use o aplicativo Big Data para enviar anúncios baseados em localização
  • Sistema de rastreamento e gerenciamento

Dia 5: Sessão 1: Como justificar Big Data a implementação de BI dentro de uma organização:

  • Definindo ROI para Big Data implementação
  • Estudos de caso para economizar tempo do analista na coleta e preparação de dados – aumento no ganho de produtividade
  • Estudos de caso de ganho de receita com rotatividade de clientes
  • Ganho de receita com anúncios baseados em localização e outros anúncios direcionados
  • Uma abordagem de planilha integrada para calcular aprox. despesa vs. ganho/economia de receita da implementação Big Data.

Dia 5: Sessão 2: Procedimento passo a passo para substituir o sistema de dados legado para Big Data Sistema:

  • Compreendendo a prática Big Data Roteiro de migração
  • Quais são as informações importantes necessárias antes de arquitetar uma implementação Big Data
  • Quais são as diferentes formas de calcular volume, velocidade, variedade e veracidade dos dados
  • Como estimar o crescimento dos dados
  • Estudos de caso em 2 Telco

Dia 5: Sessão 3 e 4: Revisão de Big Data Fornecedores e revisão de seus produtos. Sessão de perguntas/respostas:

  • AccentureAlcatel-Lucent
  • Amazônia –A9
  • APTEAN (anteriormente CDC Software)
  • Cisco Sistemas
  • Cloudera
  • Dell
  • EMC
  • GoodData Corporation
  • Guavus
  • Sistemas de dados Hitachi
  • Hortonworks
  • Huawei
  • HP
  • IBM
  • informática
  • Informações
  • Jaspersoft
  • Microsoft
  • MongoDB (Anteriormente 10Gen)
  • MU Sigma
  • Netapp
  • Soluções Ópera
  • Oracle
  • Pentaho
  • Plataforma
  • Qliktech
  • Quântico
  • Rackspace
  • Análise da Revolução
  • Salesforce
  • SAP
  • SAS Instituto
  • Sisense
  • Software AG/Terracota
  • Automação Soft10
  • Splunk
  • Sqrrl
  • Supermicro
  • Tableau Programas
  • Teradata
  • Pense em grandes análises
  • Sistemas de Marca de Maré
  • VMware (Parte da EMC)

Requisitos

  • Deve ter conhecimentos básicos do funcionamento da empresa e dos sistemas de dados em Telecom no seu domínio
  • Deve ter conhecimentos básicos de SQL/Oracle ou base de dados relacional
  • Conhecimentos básicos de Estatística (ao nível do Excel)
 35 horas

Número de participantes



Preço por participante

Declaração de Clientes (3)

Cursos Relacionados

Categorias Relacionadas