大数据

FOSS 项目聚焦:Sawmill,数据处理项目

介绍 Sawmill,一个用于丰富、转换和过滤 JSON 文档的开源 Java 库。如果您从事集中式日志记录,您可能熟悉 ELK Stack:Elasticsearch、Logstash 和 Kibana。以防您不熟悉,ELK(或 Elastic Stack,正如最近更名一样)是由三个开源组件组成的一揽子计划,每个组件负责数据管道中不同的任务或阶段。

InfluxData

您可能会问,什么是临时数据? InfluxData 可以提供答案,因为处理临时数据是该公司 InfluxData 开源平台的业务,该平台是为指标和事件定制构建的。

学习数据科学

在我最近的几篇文章中,我写了关于数据科学和机器学习的文章。万一我的热情在我的写作中不明显,让我直白地说:自从我上次遇到一项如此有望彻底改变我们所生活的世界的技术以来,已经很长时间了。

Datamation 的“领先大数据公司”报告

大数据市场正处于显着的转型期。如果密切关注这个充满活力的行业是您的职责,Datamation 通过开发“领先大数据公司”报告,让您的功课变得更容易,该报告提供了“转型期市场部门的快照”。

新颖性和异常值检测

在我最近的几篇文章中,我研究了许多机器学习可以帮助进行预测的方法。基本思想是,您使用现有数据创建模型,然后要求该模型根据新数据预测结果。

文本分类

在我最近的几篇文章中,我研究了应用机器学习的几种方法,包括监督学习和非监督学习。这一次,我想让您关注机器学习一种非常简单但功能强大且应用广泛的用途,即文档分类。

非监督学习

在我最近的几篇文章中,我研究了机器学习以及如何构建以某种方式描述世界的模型。我研究的所有示例都是“监督学习”的示例,这意味着您加载了已经以某种方式分类或分类的数据,然后创建了一个“学习”输入映射到输出的方式的模型。

Kodiak Data 的 MemCloud

使用大数据的科学家经常面临获取计算能力的高昂成本,而这些计算能力是推动数据科学领域边界和创新的必要条件。

教你的电脑

正如我在最近的两篇文章(无处不在的机器学习和为机器学习准备数据)中所写的那样,机器学习正在以多种方式影响着我们的生活。

iguazio 的持续分析解决方案

在金融服务、医疗保健和物联网等行业中,组织面临着整个数据生命周期复杂性的挑战。为了帮助企业解决大数据运营挑战并生成实时洞察,iguazio 开发了一种新的持续分析解决方案。

CyKick Labs Ltd. 的 Telepath

当顾客走进商店时,零售商不知道这个人是仅仅浏览、购物、入店行窃还是抢劫收银机。网站访问者也是如此。挑战在于防止和阻止坏人,同时又不妨碍有益的客户交易。

为机器学习准备数据

当我访问 Amazon.com 时,这家在线商店经常推荐我应该购买的产品。我知道我并不孤单,会觉得这些推荐相当诡异——它们通常是我已经在其他地方购买过的产品,或者是我正在考虑购买的产品。亚马逊是如何做到的?

MultiTaction 的 MT Canvus-Connect

“视觉协作的新时代”是 MT Canvus-Connect 的承诺,MT Canvus-Connect 是 MultiTaction 的新型实时协作软件,可在远程位置实时实现可视化触摸屏协作。

如何修复边缘

2016 年 12 月,风险投资公司 Andreessen Horowitz 的 Peter Levine 发表了一篇帖子,其中包含一个名为“回归边缘和云计算的终结”的视频。在其中,他概述了集中式计算和分布式计算之间像这样的钟摆摆动

无处不在的机器学习

统计学领域通常声誉不佳。它被认为是困难、枯燥甚至有点无用的。我的许多朋友不得不在研究生院学习统计学课程,以便他们能够分析和报告他们的研究。对他们中的许多人来说,这些课程是一种书呆子气、令人厌烦的折磨。

iguazio 的企业数据云

对 iguazio 的新旗舰企业数据云平台的描述大胆而简洁:世界上最快、最简单且成本最低的企业数据云。 iguazio 补充说,为了释放大数据、物联网和云原生应用程序的超趋势应用程序和分析的全部潜力,它开创了一种新的服务驱动型企业 d 方法