大数据是什么意思(大数据是什么意思通俗讲)
- 知识
- 2022-06-26
- 69热度
- 0评论
网友提问:
大数据是什么?
优质回答:
「大数据」(big data)和「资料科学家」(data scientist)是近年来商业界的热门关键字。不过,你感受到大数据的重要性,却未必真正了解大数据和你我的工作、和企业的关联性是什么?以下5 张图,让你快速了解大数据的商业应用。
Q1. 什么是大数据?
A : 狭义的定义是指,符合「3V」条件的数据资料,分别是:
Volume(大量):以过去的技术无法管理的资料量,资料量的单位可从TB(terabyte,一兆位元组)到PB(petabyte,千兆位元组)。
Variety(多样性):企业的销售、库存资料;网站的使用者动态、客服中心的通话纪录;社交媒体上的文字影像等企业资料库难以储存的「非结构化资料」。
Velocity(速度):资料每分每秒都在更新,技术也能做到即时储存、处理。广义的定义,《大数据的获利模式》作者城田真琴认为,还要包括具备储存、处理与分析这些资料的技术,和能够从这些资料中取出有用资讯或洞见的人才和组织。
Q2. 大数据分析和商业智慧(BI,business intelligence)有什么不同?
A : 美国顾问机构顾能(Gartner)分析师霍华?瑞斯纳(Howard Dresner)在1980年代提出「商业智慧」概念,指有系统地储存企业内、外部资料,并加以分析,辅助商务决策。瑞斯纳认为,经理人应该亲自经手资料,以达到迅速决策与提高生产力的目标。
商业智慧可分析过去发生什么事,以及为什么会发生这件事,像是利用统计学回归分析,从A产品过去一年的销量结构,找出销售下滑的原因。大数据则可根据目前发生了什么事,预测未来将发生什么事。例如,电商可即时监控销售情况,预测顾客回购周期。
Q3. 一般企业有哪些数据可用?
A :《大数据的获利模式》作者城田真琴将企业能取得的资料分为4 种:
公司本身的事业活动资料:属于公司的核心资料,例如便利商店的POS 系统资料。
公司背景资料:比方说员工的通讯录或财务报表,但是对服务顾客没有帮助。
其他公司或顾客的资料:像是顾客在社交网站上的活动纪录,就是企业即使花钱也想拿到的资料,因为对自己很有用。
公开资料:通常可以免费取得,企业应该积极运用例如政府的公开资讯,例如政府的公开资讯。
Q4. 企业如何运用数据资料?
A : 阿里巴巴副总裁车品觉提出了数据的5 大价值:
识别与串联:能够辨识出用户的资讯(手机、生日、e-mail等)
描述:举凡用户搜寻的关键字、企业的营运数字、网站活动的相关数据,企业都可以用来做为营运的仪表板。
时间:从用户的行动时间轴推测他的行为,例如刚搜寻过旅馆的使用者,在拜访其他网站时,也能即时看到旅馆广告。
预测:可以帮助公司预测销售,影响公司经营策略。
产出数据:将现有数据组合产生新的数据,像是将网路卖家的各项表现(物流、商品、客服等),综合在一起形成店铺评分机制。
Q5. 运用大数据的人,就可以称为资料科学家吗?
A : 基于前述资料的特性,大数据的储存、处理和分析绝非易事,通常需要团队支援,才能发挥出资料的最大效果。
大致来说,资料分析领域包含5 个关键职务:资料工程师与软体工程师负责资料的清理、储存和处理;资料分析师将资料视觉化,供资料科学家分析;资料科学家依据想要解决的商业命题建构模型,供决策参考;领域专家则是熟悉领域专业知识,提供专业见解供资料科学家分析参考,扮演发展决策的桥梁。
其他网友回答
这里从大数据和AI人工智能关系层面做个简单的分享!
大数据:人工智能背后的基石
大数据是人工智能的基石,目前的深度学习主要是建立在大数据的基础上,即对大数据进行训练,并从中归纳出可以被计算机运用在类似数据上的知识或规律。
简单而言何为大数据?
虽然很多人将其定义为“大数据就是大规模的数据”。
但是,这个说法并不准确!
“大规模”只是指数据的量而言。
数据量大,并不代表着数据一定有可以被深度学习算法利用的价值。
例如:地球绕太阳运转的过程中,每一秒钟记录一次地球相对太阳的运动速度、位置,可以得到大量数据。可如果只有这样的数据,其实并没有太多可以挖掘的价值!
大数据这里我们参阅马丁·希尔伯特的总结,今天我们常说的大数据其实是在2000年后,因为信息交换、信息存储、信息处理三个方面能力的大幅增长而产生的数据:
信息交换:据估算,从1986年到2007年这20年间,地球上每天可以通过既有信息通道交换的信息数量增长了约217倍,这些信息的数字化程度,则从1986年的约20%增长到2007年的约99.9%。在数字化信息爆炸式增长的过程里,每个参与信息交换的节点都可以在短时间内接收并存储大量数据。
信息存储:全球信息存储能力大约每3年翻一番。从1986年到2007年这20年间,全球信息存储能力增加了约120倍,所存储信息的数字化程度也从1986年的约1%增长到2007年的约94%。1986年时,即便用上我们所有的信息载体、存储手段,我们也不过能存储全世界所交换信息的大约1%,而2007年这个数字已经增长到大约16%。信息存储能力的增加为我们利用大数据提供了近乎无限的想象空间。
信息处理:有了海量的信息获取能力和信息存储能力,我们也必须有对这些信息进行整理、加工和分析的能力。谷歌、Facebook等公司在数据量逐渐增大的同时,也相应建立了灵活、强大的分布式数据处理集群。
大数据在应用层面:大数据往往可以取代传统意义上的抽样调查、大数据都可以实时获取、大数据往往混合了来自多个数据源的多维度信息、大数据的价值在于数据分析以及分析基础上的数据挖掘和智能决策。
美国《大西洋月刊》公布的一段A.I.聊天记录截图
延伸阅读:聊天机器人竟自创语言“对话” 脸书将其紧急关停
实际上人工智能的发展,离不开海量数据进行训练,究其根本大数据的循环往复无数次的训练和深度学习才有了人工+智能!
实际上人工智能、大数据、物联网以及云计算,彼此之间皆存在着千丝万缕的“亲缘”关系!!!
其他网友回答
由于互联网的存在大数据收集才成为可能!所谓大数据就是从海量的互联网信息中通过运用统计学、概率论的原理,去伪存真得出有用信息经过云计算成为指导有关部门的决策依据!当然必须分门别类的收集大数据,政治、军事、经济、文化、社会、各行各业等等均有所侧重!具体如何实现请问这方面的專家学者!
其他网友回答
简单来说,大数据就是大量的信息,尤其指存在于互联网和数字终端中的数字信息。大数据到底有多大?统计数据表明,在一天之中,互联网产生的全部内容可以刻满1.68 亿张DVD。IBM 公司的研究称,在整个人类文明所获得的全部数据中,有90% 是过去2 年内产生的。而到了2020 年,全世界所产生的数据规模将达到今天的44 倍。
其他网友回答
大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。 大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。
大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。