Ensemble AI Inc. 在完成 330 万美元的种子轮融资后,正寻求解决数据质量方面的难题,并助力公司构建更强大的人工智能模型。
今天的这轮融资由 Salesforce Ventures 领投,Amplo、M13 和 Motivate 也参与其中。他们支持 Ensemble 是因为这家初创公司创造了一种开创性的数据表示方法,能够在不向模型注入大量额外数据或创建更复杂模型架构的情况下提高人工智能模型的性能。
这家初创公司正在做的是利用机器学习技术来增强人工智能模型,帮助它们发现数据集之间隐藏的关系。该公司解释说,如果人工智能要能够解决现实世界的问题,就需要获取更多和更高质量的数据。许多公司都在为有限、稀疏或一维的数据集而苦苦挣扎,这使得他们的人工智能模型无法产生有意义或有用的结果。
数据科学家花费数小时试图修复他们的数据以克服这个问题,并且通过更复杂的人工智能模型架构已经取得了一些进展,但这些努力需要大量的资源和技术专长,并非每个公司都具备。
为了解决这些问题,Ensemble 创建了一个名为 Dark Matter 的新型嵌入模型,它使用“目标函数”为预测任务创建更丰富的数据表示。该公司表示,Dark Matter 能够通过轻量级的数据转换理解数据集中复杂的非线性关系。它将这些关系的复杂性提炼为简单的“数据表示”,以便工程师能够构建质量更高的人工智能模型,从而解决更困难的问题。
Ensemble 的联合创始人兼首席执行官 Alex Reneau 解释说,Dark Matter 位于数据管道内的特征工程和模型训练及推理过程之间。
他说:“我们能够让客户最大限度地利用他们正在处理的数据,即使这些数据有限、稀疏或高度复杂,使他们能够用不太全面的信息训练有效的模型。这种基础技术让数据科学家能够专注于实验,也使机器学习对于以前无法建模的问题变得可行,为我们的客户释放了新的能力。”
这家初创公司认为,Dark Matter 是合成数据的优越解决方案,合成数据通常被人工智能开发者用来弥补低质量或稀疏的数据集。它解释说,尽管 Dark Matter 确实创建了新的变量,但其机制根本不同。
因为合成数据是从高斯噪声中重新创建现有的分布,这意味着实际上没有创建新的信息。合成数据只是反映了现有数据的统计特性,因此对预测准确性没有有意义的影响,该公司解释说。
另一方面,Dark Matter 学习如何创建具有根本不同的统计特性和分布的新嵌入,从而导致可测量的预测准确性提高。
Salesforce Ventures 的 Caroline Fiegel 告诉 VentureBeat,Ensemble 提供了一个有前途的解决方案,有可能加速人工智能的采用。她解释说,许多组织由于数据质量差和潜在的个人可识别信息的使用问题,在生产中部署人工智能模型时遇到困难。
“当你深入了解并真正开始理解原因时,是因为数据是不同的。它的质量有点低,”她说,“它充满了个人可识别信息。”
Ensemble 表示,Dark Matter 已经被一些早期采用者在生物技术、医疗保健、个性化和广告技术等领域使用,并取得了有希望的结果。例如,一位生物技术客户使用其技术创建了一个能够更好地预测肠道微生物组内病毒 - 宿主相互作用的模型。
展望未来,Ensemble 表示将使用本轮的资金扩大团队,加速产品开发和市场推广计划。


