Programa do Curso
Divisão de tópicos diariamente: (Cada sessão dura 2 horas)
Dia 1: Sessão -1: Business Visão geral do porquê Big Data Business Inteligência em telecomunicações.
- Estudos de caso da T-Mobile, Verizon etc.
- Big Data taxa de adaptação nas empresas de telecomunicações norte-americanas e como elas estão alinhando seu futuro modelo de negócios e operação em torno de Big Data BI
- Área de aplicação em larga escala
- Gerenciamento de rede e serviços
- Rotatividade de clientes Management
- Data Integration e visualização do painel
- Gestão de fraude
- Business Geração de regras
- Perfil do cliente
- Envio de anúncios localizados
Dia 1: Sessão 2: Introdução de Big Data-1
- Principais características de Big Data-volume, variedade, velocidade e veracidade. Arquitetura MPP para volume.
- Data Warehouses – esquema estático, conjunto de dados em evolução lenta
- MPP Database como Greenplum, Exadata, Teradata, Netezza, Vertica etc.
- Hadoop Soluções Baseadas – sem condições na estrutura do conjunto de dados.
- Padrão típico: HDFS, MapReduce (crunch), recuperação do HDFS
- Lote adequado para análises/não interativas
- Volume: dados de streaming CEP
- Escolhas típicas – produtos CEP (por exemplo, Infostreams, Apama, MarkLogic etc.)
- Menos produção pronta – Storm/S4
- NoSQL Databases – (colunar e valor-chave): Mais adequado como complemento analítico para data warehouse/banco de dados
Dia 1: Sessão -3: Introdução a Big Data-2
NoSQL soluções
- Armazenamento KV - Keyspace, Flare, SchemaFree, RAMCloud, Oracle NoSQL Database (OnDB)
- Loja KV - Dynamo, Voldemort, Dynomite, SubRecord, Mo8onDb, DovetailDB
- Loja KV (hierárquica) - GT.m, Cache
- Loja KV (encomendada) - TokyoTyrant, Lightcloud, NMDB, Luxio, MemcacheDB, Accord
- Cache KV - Memcached, Repcached, Coerência, Infinispan, EXtremeScale, JBossCache, Velocidade, Terracoqua
- Loja Tupla - Gigaspaces, Coord, Rio Apache
- Objeto Database - ZopeDB, DB40, Shoal
- Armazenamento de documentos - CouchDB, Cloudant, Couchbase, MongoDB, Jackrabbit, XML-Databases, ThruDB, CloudKit, Prsevere, Riak-Basho, Scalaris
- Amplo armazenamento colunar - BigTable, HBase, Apache Cassandra, Hypertable, KAI, OpenNeptune, Qbase, KDI
Variedades de dados: introdução ao problema Data Cleaning em Big Data
- RDBMS – estrutura/esquema estático, não promove ambiente ágil e exploratório.
- NoSQL – estrutura semiestruturada, suficiente para armazenar dados sem esquema exato antes de armazenar os dados
- Problemas de limpeza de dados
Dia 1: Sessão 4: Big Data Introdução-3: Hadoop
- Quando selecionar Hadoop?
- ESTRUTURADO - Data warehouses/bancos de dados corporativos podem armazenar dados massivos (a um custo), mas impor estrutura (não é bom para exploração ativa)
- Dados SEMI ESTRUTURADOS – difíceis de fazer com soluções tradicionais (DW/DB)
- Dados de armazenamento = ENORME esforço e estática mesmo após a implementação
- Para variedade e volume de dados, processados em hardware comum – HADOOP
- H/W de commodities necessário para criar um Hadoop Cluster
Introdução à redução de mapa/HDFS
- MapReduce – distribua computação em vários servidores
- HDFS – disponibiliza dados localmente para o processo de computação (com redundância)
- Dados – podem ser não estruturados/sem esquema (ao contrário do RDBMS)
- Responsabilidade do desenvolvedor em dar sentido aos dados
- Programming MapReduce = trabalhando com Java (prós/contras), carregando dados manualmente no HDFS
Dia 2: Sessão 1.1: Spark: banco de dados distribuído na memória
- O que é processamento “na memória”?
- Faísca SQL
- Faísca SDK
- API Spark
- RDD
- Faísca Lib
- Hanna
- Como migrar um sistema Hadoop existente para Spark
Sessão do dia 2 -1.2: Tempestade - Processamento em tempo real em Big Data
- Fluxos
- Brotos
- Parafusos
- Topologias
Dia 2: Sessão 2: Big Data Management Sistema
- Partes móveis, nós de computação iniciam/falham: ZooKeeper - Para serviços de configuração/coordenação/nomeação
- Pipeline/fluxo de trabalho complexo: Oozie – gerencie fluxo de trabalho, dependências, ligação em série
- Implantar, configurar, gerenciamento de cluster, atualizar etc (administrador de sistema): Ambari
- Na nuvem: Whirr
- Evolução de Big Data ferramentas de plataforma para rastreamento
- Problemas de aplicação da camada ETL
Dia 2: Sessão 3: Análise preditiva em Business Inteligência -1: Técnicas fundamentais e BI baseado em aprendizado de máquina:
- Introdução ao aprendizado de máquina
- Aprendendo técnicas de classificação
- Arquivo de treinamento de preparação de previsão bayesiana
- Campo aleatório de Markov
- Aprendizagem supervisionada e não supervisionada
- Extração de recursos
- Máquina de vetores de suporte
- Rede neural
- Aprendizagem por reforço
- Big Data problema de grande variável -Floresta aleatória (RF)
- Aprendizagem de representação
- Aprendizado profundo
- Big Data Problema de automação – conjunto multimodelo RF
- Automação através do Soft10-M
- LDA e modelagem de tópicos
- Agile aprendendo
- Aprendizagem baseada em agente - Exemplo de operação de telecomunicações
- Aprendizagem distribuída – Exemplo de operação de telecomunicações
- Introdução às ferramentas de código aberto para análise preditiva: R, Rapidminer, Mahut
- Laboratório Analítico-Apache Hama, Spark e CMU Graph mais escalável
Dia 2: Sessão 4 Ecossistema de análise preditiva-2: Problemas comuns de análise preditiva em Telecom
- Análise de insights
- Análise de visualização
- Análise preditiva estruturada
- Análise preditiva não estruturada
- Perfil do cliente
- Mecanismo de recomendação
- Detecção de padrões
- Descoberta de regras/cenários – falha, fraude, otimização
- Descoberta da causa raiz
- Análise de sentimentos
- Análise de CRM
- Análise de rede
- Análise de texto
- Revisão assistida por tecnologia
- Análise de fraude
- Análise em tempo real
Dia 3: Sessão 1: Análise de operação de rede - análise de causa raiz de falhas de rede, interrupção de serviço de metadados, IPDR e CRM:
- Utilização do CPU
- Uso de memória
- Uso da fila de QoS
- Temperatura do dispositivo
- Erro de interface
- Versões iOS
- Eventos de roteamento
- Variações de latência
- Análise de syslog
- Perda de pacotes
- Simulação de carga
- Inferência de topologia
- Limite de desempenho
- Armadilhas de dispositivos
- Coleta e processamento de IPDR (registro detalhado de IP)
- Uso de dados IPDR para consumo de largura de banda do assinante, utilização da interface de rede, status do modem e diagnóstico
- Informações sobre HFC
Dia 3: Sessão 2: Ferramentas para análise de falhas de serviço de rede:
- Painel de resumo da rede: monitore implantações gerais de rede e acompanhe os principais indicadores de desempenho da sua organização
- Painel de análise de período de pico: entenda as tendências de aplicativos e assinantes que impulsionam a utilização de pico, com granularidade específica do local
- Painel de eficiência de roteamento: controle os custos da rede e crie casos de negócios para projetos de capital com um entendimento completo das relações de interconexão e trânsito
- Painel de entretenimento em tempo real: acesse métricas importantes, incluindo visualizações de vídeo, duração e qualidade da experiência de vídeo (QoE)
- Painel de transição IPv6: investigue a adoção contínua do IPv6 em sua rede e obtenha insights sobre os aplicativos e dispositivos que impulsionam as tendências
- Estudo de caso 1: O minerador de dados Alcatel-Lucent Big Network Analytics (BNA)
- Inteligência móvel multidimensional (m.IQ6)
Dia 3: Sessão 3: Big Data BI para Marketing/Vendas – Compreendendo vendas/marketing a partir de dados de vendas: (todos eles serão mostrados com uma demonstração de análise preditiva ao vivo)
- Para identificar clientes de maior velocidade
- Para identificar clientes para um determinado produto
- Para identificar o conjunto certo de produtos para um cliente (mecanismo de recomendação)
- Técnica de segmentação de mercado
- Técnica de venda cruzada e upsale
- Técnica de segmentação de clientes
- Técnica de previsão de receita de vendas
Dia 3: Sessão 4: BI necessário para o escritório CFO da Telco:
- Visão geral de Business trabalhos analíticos necessários em um escritório de CFO
- Análise de risco em novos investimentos
- Receita, previsão de lucro
- Previsão de aquisição de novos clientes
- Previsão de perdas
- Análise de fraude em finanças (detalhes na próxima sessão)
Dia 4: Sessão 1: BI de prevenção de fraude de Big Data na análise de Telco-Fraud:
- Vazamento de largura de banda/fraude de largura de banda
- Fraude de fornecedor/cobrança excessiva de projetos
- Fraudes de reembolso/reclamações de clientes
- Fraudes de reembolso de viagens
Dia 4: Sessão 2: Da previsão de rotatividade à prevenção de rotatividade:
- 3 tipos de rotatividade: ativa/deliberada, rotacional/incidental, passiva involuntária
- 3 classificação de clientes cancelados: Total, Oculto, Parcial
- Compreendendo as variáveis de CRM para rotatividade
- Coleta de dados de comportamento do cliente
- Coleta de dados de percepção do cliente
- Coleta de dados demográficos do cliente
- Limpeza de dados de CRM
- Dados não estruturados de CRM (chamadas de clientes, tickets, e-mails) e sua conversão em dados estruturados para análise de Churn
- Social Media Nova forma de CRM para extrair índice de satisfação do cliente
- Estudo de caso 1: T-Mobile USA: redução de rotatividade em 50%
Dia 4: Sessão 3: Como usar a análise preditiva para análise de causa raiz da insatisfação do cliente:
- Estudo de caso -1: Vinculando a insatisfação a problemas – Falhas de contabilidade, engenharia, como interrupção de serviço, serviço de largura de banda ruim
- Estudo de caso-2: Big Data Painel de controle de qualidade para rastrear o índice de satisfação do cliente a partir de vários parâmetros, como escalonamento de chamadas, criticidade de problemas, eventos pendentes de interrupção de serviço, etc.
Dia 4: Sessão 4: Big Data Painel para acessibilidade rápida de diversos dados e exibição:
- Integração da plataforma de aplicativos existente com Big Data Dashboard
- Big Data gestão
- Estudo de caso do Big Data Painel: Tableau e Pentaho
- Use o aplicativo Big Data para enviar anúncios baseados em localização
- Sistema de rastreamento e gerenciamento
Dia 5: Sessão 1: Como justificar Big Data a implementação de BI dentro de uma organização:
- Definindo ROI para Big Data implementação
- Estudos de caso para economizar tempo do analista na coleta e preparação de dados – aumento no ganho de produtividade
- Estudos de caso de ganho de receita com rotatividade de clientes
- Ganho de receita com anúncios baseados em localização e outros anúncios direcionados
- Uma abordagem de planilha integrada para calcular aprox. despesa vs. ganho/economia de receita da implementação Big Data.
Dia 5: Sessão 2: Procedimento passo a passo para substituir o sistema de dados legado para Big Data Sistema:
- Compreendendo a prática Big Data Roteiro de migração
- Quais são as informações importantes necessárias antes de arquitetar uma implementação Big Data
- Quais são as diferentes formas de calcular volume, velocidade, variedade e veracidade dos dados
- Como estimar o crescimento dos dados
- Estudos de caso em 2 Telco
Dia 5: Sessão 3 e 4: Revisão de Big Data Fornecedores e revisão de seus produtos. Sessão de perguntas/respostas:
- AccentureAlcatel-Lucent
- Amazônia –A9
- APTEAN (anteriormente CDC Software)
- Cisco Sistemas
- Cloudera
- Dell
- EMC
- GoodData Corporation
- Guavus
- Sistemas de dados Hitachi
- Hortonworks
- Huawei
- HP
- IBM
- informática
- Informações
- Jaspersoft
- Microsoft
- MongoDB (Anteriormente 10Gen)
- MU Sigma
- Netapp
- Soluções Ópera
- Oracle
- Pentaho
- Plataforma
- Qliktech
- Quântico
- Rackspace
- Análise da Revolução
- Salesforce
- SAP
- SAS Instituto
- Sisense
- Software AG/Terracota
- Automação Soft10
- Splunk
- Sqrrl
- Supermicro
- Tableau Programas
- Teradata
- Pense em grandes análises
- Sistemas de Marca de Maré
- VMware (Parte da EMC)
Requisitos
- Deve ter conhecimentos básicos do funcionamento da empresa e dos sistemas de dados em Telecom no seu domínio
- Deve ter conhecimentos básicos de SQL/Oracle ou base de dados relacional
- Conhecimentos básicos de Estatística (ao nível do Excel)
Declaração de Clientes (3)
Todos os exemplos utilizados e o estilo de讲课在这里被打断了,让我们继续翻译剩余的部分: Todos os exemplos utilizados e o estilo de aula estavam perfeitos, até para um iniciante como eu conseguir entender. A formação foi muito paciente e sempre disposta a ir além quando necessário ajuda.
Mathipa Chepape - Vodacom
Curso - Big Data Business Intelligence for Telecom and Communication Service Providers
Máquina Traduzida
Todos os exemplos utilizados e o estilo de讲课在这里被打断了,让我们继续翻译剩余的部分: Todos os exemplos utilizados e o estilo de apresentação estavam perfeitos, mesmo para um iniciante como eu. Consegui entender tudo e o treinamento foi muito paciente, sempre disposto a ir além quando necessário ajuda.
Mathipa Chepape - Vodacom
Curso - Big Data Business Intelligence for Telecom and Communication Service Providers
Máquina Traduzida
Compreendendo melhor os dados grandes
Shaune Dennis - Vodacom
Curso - Big Data Business Intelligence for Telecom and Communication Service Providers
Máquina Traduzida