每家公司的数据旅程都需要时间 - 构建,简化,存储和最终分析。CTO多长时间告诉创始人他们被数据存放在几个仓库中并被形成为事件数据,点击流数据,SQL和NoSql数据?他们的团队始终坚持所有这些数据源的含义。
有几次,公司甚至无法理解他们拥有的所有数据,只使用它的一小部分并部署AI模块,这会导致错误的查询,有时甚至会产生偏差。
但现在,总部位于奥斯汀的Molecula将通过其拥有8项专利的虚拟数据源技术解决这些问题。它正在为工程团队提供动力,以便更快地访问数据并为实际结果做好准备。
“他们不必像旧世界一样坐在数据副本上,并且可以访问有限的数据。大多数公司只使用其数据的百分之一,并且无法释放其余数据,因为访问副本需要时间,“Molecula创始人Higinio Maycotte说。
该创业公司有10个付费客户,并且还与Oracle合作将其产品推向市场。一些付费客户包括媒体公司和财富500强公司。仅仅四个月,Molecula已经从家人和朋友那里筹集了600万美元。
怎么开始
Molecula的旅程始于2017年,当时Maycotte推出了Pilosa,这是一个开源位图索引,它基本上将数据存储或多个数据副本分离,以可扩展的形式呈现。
大约1,650家公司使用Pilosa来分离和组织数据。就在那时,包括一家名为Texas Tribune的媒体公司在内的八家初创公司的资深人士Maycotte意识到,每个组织中的所有数据科学家都无法访问所有数据,因为它位于多个仓库中,并且有多种形式和副本。
“这就是公司不扩大规模的原因,”Molecula首席营收官Ganesh Padmanabhan说。
Ganesh已经搬到美国当工程师。他在戴尔EMC工作了11年。去年,Higinio通过一位共同的朋友与他会面并追求他的卓越销售。Ganesh喜欢Higinio关于Molecula技术的讲话,帮助公司为AI做好准备并抓住机会。
Molecula是西班牙语中的“分子”,是物质中最小的粒子。
追求敏捷
多年来,数据虚拟化已经蓬勃发展,因为世界上的数据量已经增加,人们希望尽可能地实现自动化。但是,从中获取意义的残疾已经减缓了真机学习(ML)的力量。虽然云环境可能更有效,但它也导致创建多个副本和日期存储。
Molecula正借此机会更快地缝合这些数据,这是当前行业的一个缺口。实际上,初创公司可以帮助大型组织将数据工作负载迁移到云中而无需复制。这样,客户按照云中部署的VDS而不是存储进行支付。
通过这样做,数据被压缩并更快地提供给数据工程师。
“我们将确保数据可追溯并且可以轻松召回。对于那些希望立即为数据提供动力的人来说,它是一个完美的平台,”Ganesh说。
由于数据科学家可以访问他们从未拥有的数据集,因此对此业务非常感兴趣。在接下来的18个月里,Molecula将扩大规模,为100多家公司提供服务,并从投资者那里筹集更多资金。
目前,它拥有近40名员工。Informatica,Denodo,VMware,Cisco Systems,Red Hat Cloud和Amazon Elastic Compute Cloud(EC2)等顶级数据虚拟化公司与Molecula展开竞争。
这些大公司将数据复制到不同的云环境中,而无法轻松访问数据工程师,这就是Molecula希望将这个故事带到城镇的原因。