博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
"阿里研究中心:大数据时代"分享总结
阅读量:4112 次
发布时间:2019-05-25

本文共 738 字,大约阅读时间需要 2 分钟。

概述:

此分享是关于阿里研究中心:大数据时代的分享汇总

 

分享点:

大数据4V:大量(Volume);多样(Variety);快速(Velocity)和价值(Value)数据是资产,云为数据资产提供存储、访问和计算数据来源:互联网企业:SNS、微博、视频网站、电子商务网站物联网、移动设备、终端中的商品、个人位置、传感器采集的数据联通、移动、电信等通信和互联网运营商天文望远镜拍摄的图像、视频数据、气象学里面的卫星云图数据等金融行业大数据对信息化影响:传统软件开发流程敏捷开发(快速演进)企业信息化不只是订单系统上线,订单处理也需自动化跟上通过分析师对一系列的数据、行为的分析后才能得到用户需求大数据的方向:云计算是基础设施架构大数据是灵魂资产分析、挖掘是手段发现和预测是最终目标

大数据相关技术:

分析技术:数据处理:自然语言处理技术统计和分析:A/B test; top N排行榜;地域占比;文本情感分析数据挖掘:关联规则分析;分类;聚类模型预测:预测模型;机器学习;建模仿真大数据技术:数据采集:ETL工具数据存取:关系数据库;NoSQL;SQL等基础架构支持:云存储;分布式文件系统等计算结果展现:云计算;标签云;关系图等存储:结构化数据:海量数据的查询、统计、更新等操作效率低非结构化数据:图片、视频、word、pdf、ppt等文件存储不利于检索半结构化数据:转换为结构化存储和按照非结构化存储存储问题解决方案:NoSQL技术: HDFS, HBASE, OceanBase,  MongoDB等计算:因结构变化为导致计算模式变更需求模式变化带来的计算碰到瓶颈解决方案:MapReduce技术和流计算(twitter的storm和yahoo!的S4)

 

更多详情参见附件

转载地址:http://tjqsi.baihongyu.com/

你可能感兴趣的文章
为什么快排比堆排快
查看>>
weak_ptr打破环状引用
查看>>
进程、线程比较
查看>>
线程、进程间的通信方式
查看>>
空结构体与空指针的大小
查看>>
洗牌算法
查看>>
bitmap海量数据
查看>>
预处理阶段
查看>>
模板与宏的区别(2019.10.22)
查看>>
TCP如何保证可靠传输
查看>>
静态链接、动态链接、静态重定位、动态重定位(2019.10.22)
查看>>
含有虚函数的空类的内存大小
查看>>
多态及分类(2019.10.23)
查看>>
构造函数与析构函数的调用顺序
查看>>
什么时候析构函数需要定义为虚函数
查看>>
new/delete与malloc/free的异同
查看>>
C++线程安全的单例模式
查看>>
强制类型转换
查看>>
为什么构造函数不能声明为虚函数?
查看>>
条件变量
查看>>