謝謝。很詳細的報告,看大家有沒有詢問或者是補充?
這是除了本來就規劃要開放的綠色企業憑證申請及宣告統計之外,還希望更專注在潔凈能源,包含綠電上,這個要不要先初步回應?
所以地熱已經有了,是不是?
沒錯。所以意思是不要等民間提需求,我們要主動盤點,而且特別是業界的需求,有些業界的需求,比如溝通的時候也不知道有 Open data,是跟我們要諮詢,但可以對於公開資訊的要求,轉譯成對於開放資料的要求,充實我們自己的 pipeline,這樣下次再有人問一樣的東西,也不用花這麼多的力氣,我想精神是這樣子,我覺得是非常重要的。
有嗎?Data 平臺很像沒有看到,看到的是水力購電的度數、水力機組大修的紀錄,這兩個是比較像的,或者你指的是這兩個。
瞭解,本來就有水力發電相關的放到再生能源裡面,但這邊希望不要擴展到一般性的水情,也就是會不會有旱災、水庫清淤之類的這一些題目,意思應該是這樣子。
我看起來很像沒有都列進去,但反正沒有關係,就回去把水力相關的放到再生能源當中,看是不是可以這樣處理?
對,這裡的區域是北中南東四分位或者是比本來的更細?
因為大概 10 年前在討論這個題目的時候,有聽過一種說法是,如果顆粒太細的話,會影響到某些用非常多電公司股價之類的,也就是可以完全用電就估計出產能,但因為用的那個非常清楚,所以大概就是它了,變成我們去顆粒化、把它到最小統計是沒有意義的,因為那個統計區就只有他會這樣子用電。後來台電自己也有一些調整。
在這種情況之下,舉例來講,可以等待一段時間後來更新,也就是那種細的顆粒度經過某段時間之後,像我們協調即時果菜存量資料一樣,如果果菜存量當天就釋出,當然就喪失調節市場的功能,但等 24 小時釋出,所有的人就覺得無所謂,有時很精細的顆粒度,你願意在時間尺度上稍微讓一下,等股票交易結束之後再公開還是怎麼樣,相對上比較沒有問題。
我想因為這邊說之後會來討論,我們還是希望盡可能細的精細度,但如果是有這一方面,包含營業秘密等等的考量,與其我們就把可用性破壞掉等等,還不如說我們接受某些顆粒度是稍微晚一點釋出,以上。
還有沒有其他要詢問或者是補充的?沒有的話我們就這樣子。
(報告案:主題六)
謝謝。目前看起來是以衛福部的為主,看大家有沒有要詢問或者是補充的?
對,就是資料品質,這部分之前有沒有討論過?
像 2 歲以上的部分,跟這個格式什麼都是相同,只是主責不同而已,像這個部分之前有盤點過嗎?
對,至少有連續性的部分。
嘉凱委員剛剛的詢問,也就是是不是有違規的紀錄,也就是你們已經檢證過,而且確實有影響到補助的部分。
特別可以問一些地方政府,像在公托、準公托等等,其實這些題目大概都討論過,也就是災害潛勢是不是會影響房價,在土壤液化那一波都討論過了,也就是整個社會已經有凝結到某一個情況是大家可以接受的,也就是社會規範,這些也不需要我們自己從頭想,也就是包含地方政府,大概都應該都有處理過類似的題目,也可以問一問。
看大家有沒有其他詢問或者是補充的?
謝謝。有沒有其他意見?
確實,demand side 常常價值比較高,因為我們政府通常對 demand side 比較沒有控制力,不然信令統計資料就不用花錢買了。通常 demand side 中間會有服務供應商,就要變成服務供應商也認同資料共好、數據公益等等的價值,才願意投資到 data pipeline 裡面。
老師講得很好,如果我們讓大家知道投入數據,對自己有什麼好處、對社會公益有什麼好處,以至於不投入的人會違背社會期特的話,在那個領域就會有成功案例,但這可能沒有辦法跨領域去說,好比像公衛這邊已經有一些 norm 了,但是很難立刻變成長照也要有相同的 norm,事實上是不同的供應者,所以我覺得還是需要建立標竿案例。
這也是為什麼叫「多元創新司」,不是直接叫「資料司」的其中一個原因,我們希望有多元創新的案例,不只是 suplier,而是從需求端呈現出來,不過這個挑戰很大,所以司長的工作量很大(笑)。
我想之後會有一些標竿案例,我們也會著重在老師所說的,特別是 demand side 貢獻手上的資料,以至於服務品質增加的重點,這是數據公益很重要的一點。
看大家有沒有要詢問或者要補充的?
我有一個 meta 的問題,像這些表格貼到簡報當中,顯然本來都是試算表,所以這些高應用價值領域的預計開放、已開放的資料集本身是不是可以是一個資料集?我也是看到這個表格在想出來的;我不確定我們現在的統計是用 PPT 來做這個統計或者是 Ragic 或者是試算表之類的系統?大家怎麼統計這件事?先請衛福部來回答。這張表本身要變成資料集,對你們來說會不會很困難?
所以技術上並不困難,因為已經存在某個承辦人的硬碟當中,現在只是要有一個一致的格式填報而已,像瀑布或者是漣漪,我覺得還是要讓各界比較清楚來分析從他投了這個石頭到擴大,大概花了多少時間且擴大到哪裡去,當然我們完全都是公開透明,但每次都要回來看簡報第幾頁的話,我覺得是加深資料清洗的負擔,我的想法是這樣。
所以,我覺得是不是先請多元司想一下,可能不急著這次會議之後立刻轉成資料集,但規劃一下是不是有可能大家共用某種預計開放、已開放,現在誰承辦,也就是剛剛的那些簡報當中共用欄位,也不一定要全部填滿,這樣的話,至少也許下一次再回來看因為各界的建議,所以又多了哪一些高應用價值資料的時候,我們自己可以用機器可讀的方式來做一些視覺化或是判斷,就規劃看看,不是這一次規劃完之後,就要立刻轉成資料集。
我們自己部裡是 Ragic 在地端、Google Workspace 在雲端,但是端是落地的本地雲,海纜斷掉也還可以用;我想這個應該是沒問題,在資料協作上盡可能讓後端不用反覆複製貼上,我覺得是非常好的方向,是不是多元司就往這個方向來規劃。
再看大家對於這個資料集,有沒有更多的想法?
如果沒有的話,這個部分就先這樣,我們再往下。有沒有臨時動議?
看各位委員有沒有最後要跟我們分享什麼?如果沒有的話,我們就提早半小時結束,謝謝。
我們正式開始紀錄。我也沒有準備致詞。
我們談了什麼,就是這些事情。
就我主持的。其他目前還在規劃系統,但是以我主持的開始。
我們目前測試過的自動辨識,有一定的準確率,但是還是要花一點人工。
維然這一方面很專業,因為他之前就是做這個題目。他現在是全面導入機器學習的專家。
就是 AI in the loop,人還在。
但是重複性工作當中盡量導入。
我們是不是要介紹一下,維然是不是要自我介紹一下?從拉網路線開始的。
我們有一些分工,就是我們自己試出來的做法,像 Zero trust 這些,或者是機器學習的應用,兩署是我們的使用者,也不會收他們的錢,產業署跟資安署也會用這個產品,分別會去讓資服業者、資安業者知道現在有這一套做法在擴散。
維然有個四色定理的概念,我們去做任何應用的時候,相鄰的兩層並不會找同一個 vendor,好比像微軟在這一層(Azure AD),我們在上下層就不會用微軟的產品(Intune、M365),而且每層都有兩個以上的解決方案,確保互通性。資服業者會幫我們 maintain,不是都我們自己來維護。
是哪間新創?
謝謝。
請同仁自己講一下?
謝謝。看 Isabel 要不要介紹?
後來有看到那位留言說「不是二等艙,而是沒上飛機」的朋友,張教授,寫了好幾篇。
他有一套 ontology,哲學功力深厚,很有見地,受益良多。
請院士指導。