我要講的是這個工作,我們以前都會覺得第一輪的天使或者是incubator做,可是我們在臺灣看到實際的情況是,他們也有incubator,但是帶的是另外一個方向(笑)。
也是有它在生態鏈裡的位置。但當你沒有這樣能力的時候,其實我不覺得這個只是表面,這個意思是連結上了CrunchBase、AngelList、LinkedIn,然後就來接觸,可是很可能就會被人家覺得被turn off,因為覺得沒有相應的能力。
所以,我反而覺得如果你們要帶著這一些公司去的話,可能不是完全幫他們做,但可能很多是要帶他們做,也就是你做的過程他要看到、你怎麼做的他要看到。
那當然也不是全部都是你們做的,但我的意思是,很多新創公司就是包給一個公關,那個公關成功就成功,不成功就不成功,可是他們自己的DNA還是不會因為這樣子而改變。
我覺得新創團隊的時間,其實都是最有限的資源,他們同時要做非常多事。
如果他們有easy money,而且是學國內這一套就可以拿到,甚至是too easy,這樣其實很多東西不會投注時間,因為效益不在那裡。
因此我覺得limiting factor可能不是這個產業沒有起來,而是同樣的時間能夠取得的資源,是國際的或是國內的?反而國內容易取得的話,不會花時間到國際的去。
這也是我其實一直在想,為何現在推社會創新的這些,那麼容易往國際邁進的原因是,像上次社企年會在紐西蘭,「众社會企業」做一個身障者把它轉換成通用設計師,幫旅店或者是什麼去規劃輪椅空間,作培力、有收入,而且是滿受人尊重的,這一套概念賣到紐西蘭就非常容易、非常快。
我覺得各地社會環境碰到的這種社會問題,其實是大同小異,尤其在亞洲往往是一樣的,所以當你已解決防救災、已解決什麼東西為你的職志的時候,就非常好賣。
即使英文講得不太好,但大家關心的需求被解決的時候,就是相對藍海,因為願意做這個是比較少人。但如果是鎖定臺灣這邊上下游的需要,完全是量身打造、目的就是被某家大公司併購過去,但心目中的那一家公司不是Google,那我覺得這個時候就比較困難。
我覺得有機會,這個是滿work的一件事。
好比像最近看到的case是杜奕瑾,他用齊柏林生前拍的影片當作資料,然後訓練無人機,用齊柏林的方法拍片,拍出來的效果真的不錯。
這個過程中動員了非常多,不管是航太或者是360相機、定位,或者是圖資或者是高速運算等等,這一些也都是臺灣的團隊,因為做這個題目是之前沒有人做過的,所以大家就會很願意合作。像這樣的做法,只要找到正確的題目,只要是符合社會需求,其實我覺得臺灣串聯起來的能力是很快的。
但我覺得如果產業鏈裡已經有非常固定的模式,那即使是做「智慧城市」這些題目,我覺得引進社會創新的概念就比較困難。
可是只要設一個控股子公司,馬上就拿到了?
但這個在授權上不可行。如果你data給他之後,附帶條件是不能轉授權之類的,這樣的話加值也非常困難。
我們從著作權的設計上,基本上只有能夠作延伸著作跟不能延伸著作的這兩個做法。
所以你說semi-,你的意思我聽起來是取得資料本身有限制,以及取得之後不能再轉授權給別人?
當然不是,有一些是隱私,隱私不可以開放。
像天氣資料?
這個我同意。
但是我的意思是,因為當時甲類資料、乙類資料的時候,在2014年有過技術上到底要怎麼實踐的討論。
我真的不知道這個技術上要如何做到。好比像現在要來申請、登錄這個平台,只有臺灣的新創公司才能用好了——假設這樣設計的話,資料還是交付他,但他不能轉授權?
當然不能全部open。
你講的這個模式,有點像國際上叫做Open Algorithm,MIT的Sandy已經推了好幾年了,他有一個OPAL Project,就是在做這個。
概念就像你講的,如果現在是要運用健保資料,那衛福部只出完全亂數的假資料,只是讓你知道有哪一些欄位而已,不透露任何別的訊息,因此研究者可以下載這個假資料,就針對這個假資料來寫一些統計的演算法,再把這個演算法提供給你剛剛講的評議單位。
而這個評議單位去看這個演算法,知道這個演算法的產出,不會侵害裡面任何個人的隱私,這個有一些算法可以做,有一點像白帽駭客,去看演算法有沒有侵害隱私之虞。
如果沒有的話,這就叫「統計性質」,不是「個資」。這甚至沒有「去識別化」這四個字,也不是「去識別化」,就是說這是一套統計演算法。
這時就交給健保署,健保署就在自己的data center去跑出結果,然後結果就給大家。所以這跟你講的是很類似的?
我的意思是在實際data center跑,所以是完全沒有去識別化的情況,是用raw data,按照Sandy的想法。
那我會建議你就不要把這個叫做「Semi」Open Data,這套跟「Open Data」完全是兩回事。
我們就說Open Algorithm就好了。意思是開放的反而是code,我們是bring code to data,data都是隱私的,code是大家公開的,然後執行code的結果公佈,就這樣而已,因為publish出來是統計資料,那本來就可以開放。
我要講的是,這樣子一套做法有一個法令上的限制,目前衛福部按照個資法是自己資料的各自主管機關,所以其實他只要說不執行這一套,基本上沒有任何人能要他執行這一套。
同樣的道理,這也發生所有地方政府跟甚至沒有資訊中心的部會,而且這是臺灣特有的情況,只有個資法的國家裡面只有臺灣沒有專責機關。
就算有CIO,個資法也沒有授權給CIO處理這一件事。
現在個人資料的處理就跟資訊公開一樣,主管機關是各部會。
就算現在已經有行政院的CIO,各部會在這件事上也不需要聽CIO的。
如果你要主導權,那還是要改組織法。
要看人總對組改的態度,如果人事行政總處願意說這個是院版,以目前的政治氣氛以下就過了,但是如果人事行政總處覺得等這波組改之後再說,那不管提多少版本也不會過。
DPA個資專責機關有討論,因為這個是公開討論的題目,尤其是GDPR要生效了,我們要去簽APEC的跨境傳輸協議,APEC比較簡單,因為只要有一個專責機關就好,不需要是一個獨立機關,但是歐盟就不是,必須是要專責機關,而且要有獨立性。
我們現在的想法是,想跟人總說真的不行了,要被資料禁運了,還是要生一個機關給我們,因此我們下禮拜一政務會議來討論這一件事。
所以目前確實就像你講的,每一次即使是衛福部裡面的三級機關,或者是衛福部跟勞動部要調資料,其實就跟簽國際協約一樣,這不是有沒有資訊長的問題。
交通局跟資訊局的關係,也是同一個問題。
而且連日本,本來也是像各主管機關管的,現在也有DPA了。
事實上就只剩臺灣了。全世界有個資法的國家,就只剩臺灣沒有主責機關,這個是很奧妙的情況。
當然這要扯人事制度、五權憲法之類的,我們就不用再往那個方向講(笑);但是我覺得確實形成這個是,我們成立個資更能夠被保護,就是能夠去看最新的技術發展。
因為像前一波推的去識別化,像當時財資中心所得稅的去識別化,也就是用K匿名化做,第一個可用性就不太好,第二個是K匿名化的這個東西本身,我去年看到一些paper,已經可以改用生成式網絡(generative adversarial privacy),來兼顧隱私和可用性。
如果個資監管機關沒有跟上技術的話,那就會變成各部會資訊東西自己判斷,他們看的paper是十年以前,這樣反而是對個資是威脅的。這裡我們並不是只往資訊充分利用的角度去講,也要講說監管不好的話,莫名其妙就會釋出一些有個資疑慮的東西。
因為這就是兩面都要講,因此我覺得還是要讓專業的來。
不管未來是不是有你剛剛所講的資料長,或者是資料專責機關,至少我們要先把個人資料專責機關,在組織法上做出來,我覺得這個真的是滿critical。