從 2012 年到 2015 年,大數(shù)據(jù)持續(xù)發(fā)威,IDC 市場(chǎng)調(diào)查機(jī)構(gòu)預(yù)測(cè) 2017 年大數(shù)據(jù)市場(chǎng)將價(jià)值 324 億,擁有這樣“Big Data、Big Deal”遠(yuǎn)見(jiàn)的人,正在利用大數(shù)據(jù)激蕩出最有創(chuàng)意的構(gòu)想,用數(shù)據(jù)的力量來(lái)創(chuàng)造出大量的價(jià)值。從讓資料搜尋分析平臺(tái),到利用大數(shù)據(jù)幫助癌癥治療,大數(shù)據(jù)新創(chuàng)公司這幾年內(nèi)如雨后春筍般出現(xiàn),2015 年這些“Big Data Startups”也會(huì)持續(xù)挖掘大數(shù)據(jù)的價(jià)值、微調(diào)其企業(yè)策略,期盼在市場(chǎng)中展露頭角。以下幾家新創(chuàng)公司都已經(jīng)各自獲得好幾輪金額可觀的融資,在大數(shù)據(jù)市場(chǎng)中十分有潛力,值得我們關(guān)注并參考,從中瞭解大數(shù)據(jù)的應(yīng)用方向及潛能。
SumAll
SumAll 是一家位于紐約的新創(chuàng)公司,成立于 2011 年,主要為中小型企業(yè)提供即時(shí)數(shù)據(jù)分析服務(wù)。SumAll 的線上分析平臺(tái)收集社交媒體及電子商務(wù)上的數(shù)據(jù),并進(jìn)行分析后,把可視化的分析結(jié)果展示在互動(dòng)介面上供企業(yè)客戶(hù)參考。例如社交頁(yè)面上的網(wǎng)頁(yè)流量、ebay 上的銷(xiāo)售量等數(shù)據(jù),生成每星期、每個(gè)月的分析報(bào)導(dǎo),讓企業(yè)客戶(hù)追蹤且分析使用者/消費(fèi)者。

這家公司還有一個(gè)很酷的地方:他們分了百分之十的股份給旗下的 SumAll.org —— 一家旨在用資料分析增加社會(huì)福利的非盈利組織。
Luminoso

Luminoso 成立于 2010 年,原本是麻省理工大學(xué)媒體實(shí)驗(yàn)室的一個(gè)研究項(xiàng)目,后來(lái)發(fā)展成利用人工智慧進(jìn)行文本分析的新創(chuàng)公司。從通訊工具里的訊息、網(wǎng)絡(luò)上的評(píng)論等數(shù)據(jù)來(lái)源,利用自然語(yǔ)言處理和機(jī)器學(xué)習(xí)技術(shù),幫助企業(yè)分析消費(fèi)者在各種通訊渠道中討論的話題。
舉例來(lái)說(shuō),Luminoso 提供的服務(wù)可以幫助企業(yè)追蹤時(shí)下發(fā)生的熱門(mén)討論,還可以根據(jù)需求迅速回應(yīng),如果消費(fèi)者對(duì)于某產(chǎn)品的缺陷在網(wǎng)上進(jìn)行了投訴或者抱怨,企業(yè)可以及時(shí)進(jìn)行補(bǔ)救。

Flatiron Health
同樣發(fā)源于紐約的 Flatiron Health 成立于 2012 年,是大數(shù)據(jù)應(yīng)用界中是十分有名的“醫(yī)療大數(shù)據(jù)技術(shù)”新創(chuàng)公司,主要專(zhuān)注于癌癥數(shù)據(jù)分析1。
Flatiron Health 透過(guò)各種管道收集病患的臨床紀(jì)錄、醫(yī)師診斷紀(jì)錄、患者治療結(jié)果、基因數(shù)據(jù)及繳費(fèi)紀(jì)錄等數(shù)據(jù),透過(guò)分析整合后提交給腫瘤學(xué)家,透過(guò)分析過(guò)往的治療方法跟紀(jì)錄,幫助醫(yī)生做出更好的臨床診斷跟醫(yī)治手段。全美現(xiàn)在有約 1000 名腫瘤學(xué)家在使用 Flatiron Health 的數(shù)據(jù)。

Flatiron 的分析平臺(tái) OncologyClound 百分之百致力于分析腫瘤學(xué)數(shù)據(jù),不過(guò) Flatiron 公司也表示,現(xiàn)在全美只有 4% 的癌癥病人參與臨床試驗(yàn),另外 96% 無(wú)法取得的癌癥病人數(shù)據(jù)則成為大數(shù)據(jù)分析中的缺口。
Domo
Domo 成立于 2010 年,總部位于猶他州鹽湖城,是一家為企業(yè)決策層提供商業(yè)智慧(BI)的初創(chuàng)公司。2014 年就累積了約有 500 多家簽約客戶(hù),其中包括了 National Geographic、eBay、Ogio 及 GoodWill 等。
Domo 的商業(yè)智慧云端平臺(tái)可以即時(shí)分析多方資料,將多方來(lái)源提供的結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)以即時(shí)、視覺(jué)化的方式呈現(xiàn)出來(lái),不但幫助企業(yè)做決策,也是一個(gè)業(yè)務(wù)管理平臺(tái)。

Tamr
Tamr 成立于 2013 年,其技術(shù)來(lái)自于麻省理工的電腦與人工智慧實(shí)驗(yàn)室,由麻省理工學(xué)院教授兼數(shù)據(jù)專(zhuān)家 Michael Stonebraker 跟種子投資家 Andy Palmer 共同創(chuàng)辦,在 2014 年正式營(yíng)運(yùn)。
大數(shù)據(jù)的其中一個(gè)問(wèn)題就是資料量太大了,而且資料來(lái)源劇增又不斷變換,Tamr 的機(jī)器學(xué)習(xí)演算法跟軟件能有效而大規(guī)模地廣泛整合和管理現(xiàn)有和未來(lái)的多種數(shù)據(jù)來(lái)源,大量降低數(shù)據(jù)來(lái)源的搜集與連結(jié)所用的時(shí)間,同時(shí)辨別資料來(lái)源及之間的關(guān)聯(lián)。

Alpine Data Labs
Alpine Data Labs 成立于 2010 年,總部位于舊金山,算是十分有名的大數(shù)據(jù)分析挖掘軟件新創(chuàng)公司,該公司總裁兼首席執(zhí)行長(zhǎng) Joe Otto 和首席產(chǎn)品長(zhǎng) Steven Hillion 都來(lái)自于被云端儲(chǔ)存服務(wù)提供商 EMC 收購(gòu)的 Greenplum 公司。

大部份的大數(shù)據(jù)新創(chuàng)公司都在做“資料可視化(Data Visualization)”,Alpine 則是提供大數(shù)據(jù)及 Hadoop 的預(yù)測(cè)性分析功能,且號(hào)稱(chēng)是全球第一個(gè)針對(duì)大數(shù)據(jù)的團(tuán)隊(duì)合作分析解決方案。
DataStax
DataStax 成立于 2010 年,總部位于加州,在去年 9 月曾獲得驚人的 1 億 600 萬(wàn)美元 E 輪融資。
DataStax 主要業(yè)務(wù)是開(kāi)發(fā)和銷(xiāo)售開(kāi)源分布式數(shù)據(jù)庫(kù) Apache Cassandra 的商業(yè)化版本。Apache Cassandra 是高擴(kuò)展性、高容錯(cuò)的 NoSQL 數(shù)據(jù)庫(kù),比傳統(tǒng)的關(guān)系式數(shù)據(jù)庫(kù)多了許多優(yōu)勢(shì),其設(shè)計(jì)不僅兼顧了擴(kuò)展性和開(kāi)發(fā)靈活性,而且搜尋效率也相當(dāng)不錯(cuò),特別適合大數(shù)據(jù)的儲(chǔ)存,像是 Cisco、eBay 等大公司都在使用這種數(shù)據(jù)庫(kù)。

Altiscale
Hadoop 在這幾年內(nèi)被公認(rèn)成為大數(shù)據(jù)的主流技術(shù),而 Hadoop 也是 Altiscale 這家新創(chuàng)公司能夠迅速成長(zhǎng)茁壯的原因。

Altiscale 成立于 2012 年,總部在加州 Palo Alto,其 CEO 兼創(chuàng)辦人是曾在 Yahoo 任職首席技術(shù)長(zhǎng)(Chief Technology Officer)的 Raymie Stata ,其高層還有同樣來(lái)自 Yahoo 曾擔(dān)任首席架構(gòu)師(Chief Architect)的 David Chaiken。相信大家都知道 Yahoo 就是 Hadoop 的發(fā)源地,那這家由 Yahoo 前任高管們所創(chuàng)立的大數(shù)據(jù)公司主打“Hadoop-as-a-Service”也就一點(diǎn)都不奇怪了。
Altiscale 的服務(wù)是解決 Hadoop 的抽象性與復(fù)雜度,為工程師搭建一個(gè)完整的 Hadoop 環(huán)境,并且對(duì)其進(jìn)行維護(hù)與管理,讓使用者可以更專(zhuān)注于數(shù)據(jù)和應(yīng)用。
WibiData
WibiData 位于舊金山的創(chuàng)業(yè)公司,成立于 2010 年,聯(lián)合創(chuàng)始人 Christophe Bisciglia 為企業(yè)數(shù)據(jù)管理分析公司Cloudera 的聯(lián)合創(chuàng)始人之一,WibiData 的另一名聯(lián)合創(chuàng)始人 Aaron Kimball 則是 Cloudera 聘用的第一個(gè)工程師2。

這家公司所開(kāi)發(fā)的 WibiEnterprise 平臺(tái)是由一系列的開(kāi)源Apache 技術(shù)建構(gòu)而成,其中包含了 Hadoop、HBase 和 Cassandra,以及用于即時(shí)收集、分析、服務(wù)數(shù)據(jù)的 Kiji 開(kāi)源框架,其平臺(tái)的功能是為消費(fèi)者即時(shí)打造客制化的推薦內(nèi)容及相關(guān)搜尋結(jié)果,和電子商務(wù)龍頭 Amazon 所做的類(lèi)似。
