您的位置:首页 > 女性

数据分析师的“无界画布”:实时交互预测,可拖拽的AutoML系统

时间:2019-07-14
sunbet下载

65c2dc5ac929499486a0f1d1c2e935d9

生成大数据摘要

MIT

编辑:洪英飞,曹培新

记得《复仇者联盟2》里面,当钢铁侠和博士创建欧闯时,使用全息投影将3D数据投射到空中,然后用双手直接操纵数据?

c3d92c1f1e6642f4805a241223733cfa

不幸的是,这样的系统还没有成为现实。

什么限制了我们操纵钢铁侠等数据的能力?如果您暂时还没有想到答案,那么让我们来看看实现这一目标所需的技术。

首先,它必须是全息投影。许多人可能认为这种技术的局限性绝对不是一个好的全息投影。确实,全息投影还不成熟,但在目前的发展中,并不是现有技术不能将数据表实时投影到3D空间中。还记得5月中旬Magic Leap收购的Mimesys公司吗?让我们来看看公司在全息投影方面做了些什么。

30856497c0294bc08fe7e837374a28b3

建筑模型和人都有全息投影,人们可以与模型互动。这是一个网络朋克吗?

也就是说,虽然边界的处理仍然存在一些缺陷,但将数据表投射到空中并进行操作并非遥不可及。

什么是斯塔克的印章?

答案是智慧。因为即使我们将各种数据表投射到空中,并且各种传感器如手镯和戒指都可以反映我们对电脑的操作形成指令,但如果没有智能,我们只会使用更酷。操作Excel的姿势。您拖动一个表单并实现ctrl + c& ctrl + v。

两所大学的研究人员正试图突破这一瓶颈。

不久前,麻省理工学院和布朗大学的研究人员开发了一种在触摸屏上运行的交互式智能数据分析系统,称为Northstar,它在云中运行并支持任何触摸屏设备,包括智能手机。和大型互动显示。

更重要的是,它可以基于用户操作实时生成机器学习模型,以在其数据集上运行预测任务。

d8317d00d305482a8460b4967d35c4e0

并且感谢新的AutoML组件:VDS

VDS首次出现在ACM SIGMOD会议上发表的论文中,使用现在流行的人工智能技术自动机器学习(AutoML),它允许没有数据科学的人根据他们的数据集训练AI模型。作出预测。

例如,医生可以使用该系统来帮助预测哪些患者更容易患某些疾病,而企业主也可以通过该系统预测销售情况。用户还可以使用交互式显示器实时协作。该系统的目的是使用户更容易执行复杂的数据分析,同时确保分析的速度和准确性,并实现数据科学的普及。

“即使是不了解数据科学的咖啡店老板也应该能够预测他们在未来几周的销售情况,以确定购买量,”该论文的共同作者兼北极星项目的长期负责人蒂姆克拉斯卡说。他是麻省理工学院计算机科学与人工智能实验室(CSAIL)的电气工程和计算机科学副教授,也是新数据系统和人工智能实验室(DSAIL)的创始人之一。

37573f4dc6e54f259afabcf8ce0fe92c

目前,自动化机器学习技术的优化基于DARPA D3M自动化机器学习竞赛,该竞赛每六个月对最佳性能的AutoML工具进行竞争。

这一新成就是基于麻省理工学院与北极星的布朗研究人员多年的合作。四年多来,研究人员发表了大量详细介绍Northstar组件的论文,包括交互式界面,多平台操作,加速运营结果和用户行为研究。

Northstar系统以空白白色界面开始。用户将数据集上载到系统后,数据集将显示在左侧的“数据集”框中。任何数据标签都会自动填充到界面下方的“属性”框中。界面上还有一个“操作员”框,其中包含各种算法和新的AutoML工具。所有数据都在云中存储和分析。

e3e9fc4de1064a7f8e06a13c64ec2654

让我们用一个例子详细讨论它:

想象一下,一群医学研究人员想要探索特定年龄组特定疾病的可能性。

他们将模式检查算法拖放到界面的中间,最初显示为空白框。

96cf59d81e64479490fdca8027ff3396

作为输入,它们将标记的疾病特征(例如“血液”,“感染性”和“新陈代谢”)移动到算法框中。

6e950cf13c70408493b03c85bd21482d

形状图表。

0c5815183e07403582231cbe1f8b3a57

线将它们连接在一起,算法自动计算不同年龄的三种疾病的关联和发现。

b0fd42167d924036bbff303fe59655a3

“它就像一块大而无界的画布,你可以在这里展示你想要的一切,”Northstar交互界面的主要开发者Zgraggen说道。 “您还可以将所有内容链接在一起以处理更复杂的问题。问题“。

使用VDS,用户现在可以个性化他们的模型以适应他们的分析任务,并对他们自己的数据集执行预测分析,例如数据预测,图像分类或复杂图形结构的分析。

以上述医学调查为例,医学研究人员希望根据数据集的特征预测哪些患者可能患有血液病。他们将“AutoML”拖动到算法列表中的数据集中。系统首先生成带有“目标”标签的空白框。研究人员将“血液”标签拖到空白框中。系统将自动找到性能最佳的机器学习算法,显示为不断更新的精度选项卡百分比。用户可以随时停止该过程,优化搜索,并检查每个模型的错误率,结构,计算和其他事项。

请观看视频演示:

根据研究人员的说法,VDS是迄今为止最快的交互式AutoML工具,部分归功于他们定制的“估算引擎”。引擎位于接口和云存储之间。引擎自动创建数据集的几个代表性样本,以便逐步处理,以便在几秒钟内生成高质量的结果。

“我们花了两年时间设计VDS以适应数据科学家的想法,”该论文的另一位作者尚说。 VDS可以根据各种编译规则立即确定应该为用户提前实施哪些模型和预处理步骤。

在机器学习模型的选择中,它可以从大量的机器学习算法中进行选择,并在样本集上运行模拟,同时记录结果并优化选择。在提供快速近似后,系统还会在后端细化结果。

“至于预测,用户不想等待四个小时才能获得第一个结果。用户希望实时查看发生的情况,以便在发现错误时,用户可以立即纠正。但这通常是不可能的在任何其他系统中。“,Kraska说。

The researchers evaluated the tools on 300 real data sets. VDS predictions are roughly the same as other state-of-the-art AutoML systems, but VDS predictions can be generated in seconds, much faster than other tools, which often take minutes to hours. In order to run the results.

With Northstar's VDS component, we got a two-dimensional interactive intelligent data analysis system, perhaps a little distance from Iron Man's lab, but if one day Northstar adds holographic projection to the next generation analysis system, then Maybe I can sit on the sofa with a small hand: "Javis, send my watch to the boss."

Related reports:

xx
日期归档
  • 友情链接:
  • sunbet官方网站 版权所有© www.viagra1sideeffects.com 技术支持:sunbet官方网站| 网站地图