Categories
最新消息

首發|「行星數據」完成百萬級別首輪融資,由同方金控清弘基金投資


10月17日消息,創業邦獲悉,環境大數據「生產商」行星數據於近日完成百萬級別首輪融資,投資方為同方金控清弘基金。CEO白純鈺表示,本輪資金主要用於演算法優化、團隊建設和算力增強方面。

環境數據是環境健康、公共衛生等領域科研產業化的基礎。但以前國內大氣質量濃度都是採用地面採樣檢測系統,全國只有1400多個國家級地面站,平均一個站點只覆蓋1-2平方公里,巨大的空間沒有被覆蓋。且採樣設備技術迭代慢,數據質量和格式不統一,易形成「數據孤島」。衛星定量遙感與人工智慧演算法技術的發展,讓徹底打通環境數據成為了可能。

本文文章插圖來源於行星數據,經授權使用

行星數據的技術來源於創始人劉陽教授在美攻讀博士期間的研究成果,以及其作為教授帶領團隊攻堅科研的多年積累。2016年劉陽博士開始為環保部、中科院等國家級科研機構提供歷史環境數據;同年,由劉陽團隊歸國的李莘莘博士完成了覆蓋中國全境的PM2.5演算法開發,與深耕大氣污染治理技術的白純鈺合作創立行星數據。

現階段行星數據仍以解決政府需求為主,如污染源監控,各級政府污染控制政策效果評估等。但隨著中國整體環境數據基礎逐步完善,行星數據希望最終實現環境數據在公共衛生和精準醫療領域的深度應用。

白純鈺表示,霧霾、臭氧問題對於人體健康有巨大影響,行星數據的初衷就是希望把這些數據徹底高解析度量化,最終應用到跟環境,尤其是大氣環境相關疾病的預測演算法和精準醫療方面。

據介紹,現階段阜外醫院、301醫院等都在進行一些精準醫療探索,需要涉及到生活習慣、背景、基因等數據,但關於大氣環境這部分數據仍存在較大缺失。「墨跡天氣上的PM2.5值只是採樣點數據,這個數據跟你個人的關係不大,我們想告訴你的是你身邊此時此刻的PM2.5和臭氧是多少。」

這個數字可能對於哮喘病人、孕婦、心腦血管疾病患者有一定的影響,未來行星數據可以推算出哪些病人會受影響,並實施精準推送。因此精準醫療將是行星數據持續探索的未來藍圖。

以衛星、近空、地面和人口等數據為參數的演算法生產出的空氣質量數據,目前行星數據可提供的數據產品有6種,包括PM2.5、二氧化氮、二氧化硫、臭氧、甲醛以及顆粒物組分。

通過將推演出的數據和地面站檢測到的數據作比較,目前行星數據提供的數據相關係數達0.9,即誤差控制在了10%左右。這也是客戶選擇行星數據的重要考量因素。

同時,行星數據也將在接下來提升自身的人力和算力,並將中國整體區域分為幾個片區,不同片區採用不同模型提升準確性。白純鈺表示,行星數據數據來源由遙感衛星、地面監測裝置、大氣化學模式。用這些信息構建的機器學習模型相當於在每平方公裡布置了一個虛擬地面空氣質量監測站,達到中國全時空覆蓋。

白純鈺介紹,行星數據預計一年內以蘇州市建立標杆城市,提升算力,實現從數據清洗篩選到模型計算到輸出全部在5分鐘內結束。接下來逐步推廣到全中國的城市,打好底層數據,在輸出數據的同時行星數據也在吸收當地一些採樣數據,讓數據更加精準,預計三年以後能實現最終藍圖。

現階段,行星數據主要靠數據收入,不做二次開發。行星數據為客戶提供帶時間、經緯度標的質量濃度數據,以單個像元計價,按照時空累計收費。

行星數據現正和科研類客戶包括301醫院、環保部規劃院等進行PM2.5時空分佈研究;和阜外醫院進行霧霾和心血管疾病的流行病學研究;同時也如蘇州市環保局合作,共同研究蘇州超標排放監測等。

機器學習模式對輸入數據和算力的要求很高,行星數據目前使用本地高性能單機和雲計算混合使用的模式,並致力於構建自己的小型高性能計算集群。但在衛星遙感數據層面,基於中美關係的敏感,美國科研衛星數據的收集可能會受阻。

因此,如果行星數據順利完成兩輪融資,行星數據之後可能會發射屬於自己的大氣遙感衛星以保證穩定的數據來源。

談及核心優勢,白純鈺表示,行星數據目前擁有較強的演算法建模開發、訓練的能力。這樣較強的項目原創技術正是投資方同方金控清弘基金選擇下注的要素之一,而這正是基於背後具備強大研發能力的團隊。

行星數據團隊目前15人左右,包括有中科院遙感所、清華環境學院和劉陽美國科研團隊博士、博士后成員。演算法開發、數據運維和產品設計是主要的人力投入。目前以蘇州為總部負責科研演算法產業化和市場推廣,亞特蘭大研發中心負責數據預處理和演算法革新。

首輪融資后,行星數據預計在未來三年內實現1500萬的營收目標,並計劃於2021年3月開啟新一輪融資。

本文文章頭圖來源於攝圖網,經授權使用。本文為創業邦原創,未經授權不得轉載,否則創業邦將保留向其追究法律責任的權利。如需轉載或有任何疑問,請聯繫[email protected]。