大数据

FOSS 项目聚焦: Sawmill, 数据处理项目

介绍 Sawmill,一个用于丰富、转换和过滤 JSON 文档的开源 Java 库。如果您从事集中日志记录,您可能熟悉 ELK Stack:Elasticsearch、Logstash 和 Kibana。以防万一您不熟悉,ELK(或 Elastic Stack,正如最近更名的一样)是由三个开源组件组成的软件包,每个组件负责数据管道中不同的任务或阶段。

InfluxData

您可能会问,什么是短暂数据? InfluxData 可以提供答案,因为处理短暂数据是该公司 InfluxData 开源平台的业务,该平台是为指标和事件定制构建的。

学习数据科学

在我的前几篇文章中,我写了关于数据科学和机器学习的文章。如果我的热情在我的写作中还不明显,让我直白地说:自从我上次遇到一项如此有可能彻底改变我们生活的世界的技术以来,已经过了很长时间了。

Datamation 的“领先大数据公司”报告

大数据市场正处于显著的转型时期。如果密切关注这个充满活力的行业是您的职责,Datamation 通过开发“领先大数据公司”报告,让您的功课变得更容易,该报告提供了“转型市场领域的快照”。

新颖性和异常值检测

在我的前几篇文章中,我研究了许多机器学习可以帮助进行预测的方法。基本思想是,您使用现有数据创建一个模型,然后要求该模型根据新数据预测结果。

文本分类

在我的前几篇文章中,我研究了几种应用机器学习的方法,包括监督学习和非监督学习。这一次,我想让您关注机器学习一种出人意料地简单但功能强大且应用广泛的用途,即文档分类。

非监督学习

在我的前几篇文章中,我研究了机器学习以及如何构建一个以某种方式描述世界的模型。我研究的所有示例都是“监督学习”,这意味着您加载的数据已经以某种方式被分类或归类,然后创建一个“学习”输入映射到输出的方式的模型。

Kodiak Data 的 MemCloud

使用大数据的科学家经常面临获取计算能力的高成本,而这些计算能力是突破界限和在数据科学领域进行创新所必需的。

教你的电脑

正如我在之前的两篇文章(无处不在的机器学习和为机器学习准备数据)中所写的那样,机器学习正在以多种方式影响我们的生活。

iguazio 的持续分析解决方案

在金融服务、医疗保健和物联网等行业中,组织面临着整个数据生命周期复杂性的挑战。为了帮助企业解决大数据运营挑战并生成实时洞察,iguazio 开发了一种新的持续分析解决方案。

CyKick Labs Ltd. 的 Telepath

当购物者进入商店时,零售商不知道这个人是仅仅浏览、购物、入店行窃还是抢劫收银机。网站访问者也是如此。挑战在于防止和阻止坏人,同时不妨碍有益的客户交易。

为机器学习准备数据

当我去 Amazon.com 时,这家在线商店经常推荐我应该购买的产品。我知道我并不孤单,认为这些推荐可能相当诡异——它们通常是我已经在其他地方购买过的产品,或者是我正在考虑购买的产品。亚马逊是如何做到的?

MultiTaction 的 MT Canvus-Connect

“视觉协作的新时代”是 MT Canvus-Connect 的承诺,MultiTaction 的新实时协作软件,可在远程位置之间实时实现视觉触摸屏协作。

如何修复边缘计算

2016 年 12 月,风险投资公司 Andreessen Horowitz 的 Peter Levine 发布了一篇帖子,其中包含一个名为“回归边缘计算和云计算的终结”的视频。在其中,他概述了集中式计算和分布式计算之间的钟摆式摆动,如下所示

无处不在的机器学习

统计领域通常声誉不佳。它被认为是困难、无聊甚至有点无用的。我的许多朋友不得不在研究生院学习统计学课程,以便他们能够分析和报告他们的研究。对他们中的许多人来说,这些课程是一种书呆子气、令人厌烦的折磨。

iguazio 的企业数据云

对 iguazio 新旗舰企业数据云平台的描述大胆而简洁:世界上最快、最简单且成本最低的企业数据云。 iguazio 补充说,为了释放大数据、物联网和云原生应用程序的超级趋势应用程序和分析的全部潜力,它开创了一种新的服务驱动的企业 d 方法