Investor's wiki

大数据

大数据

##什么是大数据?

大数据是指以不断增长的速度增长的大量、多样化的信息集。它包括信息量、创建和收集信息的速度或速度,以及所涵盖数据点的种类或范围(称为大数据的“三个 v”)。大数据通常来自数据挖掘并以多种格式出现。

大数据如何运作

大数据可以分为非结构化或结构化。结构化数据由组织已在数据库和电子表格中管理的信息组成;它通常是数字性质的。非结构化数据是无组织且不属于预定模型或格式的信息。它包括从社交媒体来源收集的数据,这些数据有助于机构收集有关客户需求的信息。

大数据可以从社交网络和网站上公开分享的评论中收集,通过问卷调查、产品购买和电子签到从个人电子产品和应用程序中自愿收集。智能设备中传感器和其他输入的存在允许在广泛的情况和环境中收集数据。

大数据通常存储在计算机数据库中,并使用专门设计用于处理大型复杂数据集的软件进行分析。许多软件即服务(SaaS) 公司专门管理此类复杂数据。

大数据的用途

数据分析师查看不同类型数据之间的关系,例如人口统计数据和购买历史,以确定是否存在相关性。此类评估可以由专注于将大数据处理成可消化格式的第三方在内部或外部进行。企业经常利用这些专家对大数据的评估将其转化为可操作的信息。

许多公司,例如 Alphabet 和 Meta(前身为 Facebook),通过向社交媒体上的用户和网上冲浪的用户投放有针对性的广告,利用大数据产生广告收入。

公司中几乎每个部门都可以利用数据分析的结果,从人力资源和技术到营销和销售。大数据的目标是提高产品上市速度,减少获得市场采用、目标受众和确保客户满意所需的时间和资源。

##大数据的优缺点

可用数据量的增加既带来了机遇,也带来了问题。一般来说,拥有更多关于客户(和潜在客户)的数据应该能让公司更好地定制产品和营销工作,以创造最高水平的满意度和回头客。收集大量数据的公司有机会进行更深入、更丰富的分析,以造福所有利益相关者

鉴于当今个人可用的个人数据量,公司采取措施保护这些数据至关重要;这个话题已成为当今网络世界的热门话题,尤其是在过去几年公司经历的许多数据泄露事件中。

虽然更好的分析是积极的,但大数据也会产生过载和噪音,降低其有用性。公司必须处理大量数据,并确定哪些数据代表了与噪声相比的信号。决定是什么使数据相关成为关键因素。

此外,数据的性质和格式可能需要在对其采取行动之前进行特殊处理。由数值组成的结构化数据可以很容易地存储和排序。电子邮件、视频和文本文档等非结构化数据可能需要应用更复杂的技术才能变得有用。

## 强调

  • 大数据是大量不同的信息,它们以越来越多的速度和越来越快的速度到达。

  • 大数据通常存储在计算机数据库中,并使用专门设计用于处理大型复杂数据集的软件进行分析。

  • 大数据可以是结构化的(通常是数字的,易于格式化和存储)或非结构化的(更自由的形式,更不易量化)。

  • 公司中几乎每个部门都可以利用大数据分析的结果,但处理其混乱和噪音可能会带来问题。

  • 大数据可以从社交网络和网站上的公开分享评论中收集,从个人电子产品和应用程序中自愿收集,通过问卷调查、产品购买和电子签到。