對,應該可以有,很難說沒有社會價值。
我們至少下次在這邊當作一個事項聽一次,中間如果隨時需要我們協助,打幾個電話的話,就隨時讓我們知道。
事前有收到書面意見,是不是稍微回應一下?
謝謝。看大家有沒有其他補充或者是詢問的?
如果沒有的話,我們再往下。
(報告案:主題四)
謝謝。看大家有沒有要詢問或者是補充?
這些是 top down 或者是有回應民眾的需求?
所以比較像在 data 平臺上累積了很多需求,我們滿足,而不是這次大家有全新的需求,聽起來是這樣的意思。
這個主要是資料品質的問題。
因為有的醫事人員停業,30 天之內申請就可以了,也就是在最前端就有時間差,我們系統這邊可以做的比較有限,也就是要業務那邊做,如果系統這邊可以加速的話,這部分我們盡量加油,謝謝。
謝謝。有的時候綜整回應也可以,不一定每一則去留言,但如果特別是我們有參採的,大概要很具體去回。剛剛的部分是不是可以綜合回應?
謝謝。因為蔡委員一次看到全部科研計畫,包含我記得也有像一個食安智慧先島,包含環境研究所等等,大概會散在這些地方,但是作研究是一回事,如果民間對這些資料看了之後,比較能夠有這邊強調高社會應用價值的話,或許也值得從研究那一邊來的這些資料看怎麼樣介接過來到 Open data 平臺,麻煩稍微瞭解一下,謝謝。
看有沒有其他要提出來的?
如果沒有的話,我們就往下。
謝謝。很詳細的報告,看大家有沒有詢問或者是補充?
這是除了本來就規劃要開放的綠色企業憑證申請及宣告統計之外,還希望更專注在潔凈能源,包含綠電上,這個要不要先初步回應?
所以地熱已經有了,是不是?
沒錯。所以意思是不要等民間提需求,我們要主動盤點,而且特別是業界的需求,有些業界的需求,比如溝通的時候也不知道有 Open data,是跟我們要諮詢,但可以對於公開資訊的要求,轉譯成對於開放資料的要求,充實我們自己的 pipeline,這樣下次再有人問一樣的東西,也不用花這麼多的力氣,我想精神是這樣子,我覺得是非常重要的。
有嗎?Data 平臺很像沒有看到,看到的是水力購電的度數、水力機組大修的紀錄,這兩個是比較像的,或者你指的是這兩個。
瞭解,本來就有水力發電相關的放到再生能源裡面,但這邊希望不要擴展到一般性的水情,也就是會不會有旱災、水庫清淤之類的這一些題目,意思應該是這樣子。
我看起來很像沒有都列進去,但反正沒有關係,就回去把水力相關的放到再生能源當中,看是不是可以這樣處理?
對,這裡的區域是北中南東四分位或者是比本來的更細?
因為大概 10 年前在討論這個題目的時候,有聽過一種說法是,如果顆粒太細的話,會影響到某些用非常多電公司股價之類的,也就是可以完全用電就估計出產能,但因為用的那個非常清楚,所以大概就是它了,變成我們去顆粒化、把它到最小統計是沒有意義的,因為那個統計區就只有他會這樣子用電。後來台電自己也有一些調整。
在這種情況之下,舉例來講,可以等待一段時間後來更新,也就是那種細的顆粒度經過某段時間之後,像我們協調即時果菜存量資料一樣,如果果菜存量當天就釋出,當然就喪失調節市場的功能,但等 24 小時釋出,所有的人就覺得無所謂,有時很精細的顆粒度,你願意在時間尺度上稍微讓一下,等股票交易結束之後再公開還是怎麼樣,相對上比較沒有問題。
我想因為這邊說之後會來討論,我們還是希望盡可能細的精細度,但如果是有這一方面,包含營業秘密等等的考量,與其我們就把可用性破壞掉等等,還不如說我們接受某些顆粒度是稍微晚一點釋出,以上。
還有沒有其他要詢問或者是補充的?沒有的話我們就這樣子。
謝謝。目前看起來是以衛福部的為主,看大家有沒有要詢問或者是補充的?
對,就是資料品質,這部分之前有沒有討論過?
像 2 歲以上的部分,跟這個格式什麼都是相同,只是主責不同而已,像這個部分之前有盤點過嗎?
對,至少有連續性的部分。
嘉凱委員剛剛的詢問,也就是是不是有違規的紀錄,也就是你們已經檢證過,而且確實有影響到補助的部分。
特別可以問一些地方政府,像在公托、準公托等等,其實這些題目大概都討論過,也就是災害潛勢是不是會影響房價,在土壤液化那一波都討論過了,也就是整個社會已經有凝結到某一個情況是大家可以接受的,也就是社會規範,這些也不需要我們自己從頭想,也就是包含地方政府,大概都應該都有處理過類似的題目,也可以問一問。
看大家有沒有其他詢問或者是補充的?
謝謝。有沒有其他意見?
確實,demand side 常常價值比較高,因為我們政府通常對 demand side 比較沒有控制力,不然信令統計資料就不用花錢買了。通常 demand side 中間會有服務供應商,就要變成服務供應商也認同資料共好、數據公益等等的價值,才願意投資到 data pipeline 裡面。
老師講得很好,如果我們讓大家知道投入數據,對自己有什麼好處、對社會公益有什麼好處,以至於不投入的人會違背社會期特的話,在那個領域就會有成功案例,但這可能沒有辦法跨領域去說,好比像公衛這邊已經有一些 norm 了,但是很難立刻變成長照也要有相同的 norm,事實上是不同的供應者,所以我覺得還是需要建立標竿案例。
這也是為什麼叫「多元創新司」,不是直接叫「資料司」的其中一個原因,我們希望有多元創新的案例,不只是 suplier,而是從需求端呈現出來,不過這個挑戰很大,所以司長的工作量很大(笑)。
我想之後會有一些標竿案例,我們也會著重在老師所說的,特別是 demand side 貢獻手上的資料,以至於服務品質增加的重點,這是數據公益很重要的一點。
看大家有沒有要詢問或者要補充的?
我有一個 meta 的問題,像這些表格貼到簡報當中,顯然本來都是試算表,所以這些高應用價值領域的預計開放、已開放的資料集本身是不是可以是一個資料集?我也是看到這個表格在想出來的;我不確定我們現在的統計是用 PPT 來做這個統計或者是 Ragic 或者是試算表之類的系統?大家怎麼統計這件事?先請衛福部來回答。這張表本身要變成資料集,對你們來說會不會很困難?
所以技術上並不困難,因為已經存在某個承辦人的硬碟當中,現在只是要有一個一致的格式填報而已,像瀑布或者是漣漪,我覺得還是要讓各界比較清楚來分析從他投了這個石頭到擴大,大概花了多少時間且擴大到哪裡去,當然我們完全都是公開透明,但每次都要回來看簡報第幾頁的話,我覺得是加深資料清洗的負擔,我的想法是這樣。
所以,我覺得是不是先請多元司想一下,可能不急著這次會議之後立刻轉成資料集,但規劃一下是不是有可能大家共用某種預計開放、已開放,現在誰承辦,也就是剛剛的那些簡報當中共用欄位,也不一定要全部填滿,這樣的話,至少也許下一次再回來看因為各界的建議,所以又多了哪一些高應用價值資料的時候,我們自己可以用機器可讀的方式來做一些視覺化或是判斷,就規劃看看,不是這一次規劃完之後,就要立刻轉成資料集。
我們自己部裡是 Ragic 在地端、Google Workspace 在雲端,但是端是落地的本地雲,海纜斷掉也還可以用;我想這個應該是沒問題,在資料協作上盡可能讓後端不用反覆複製貼上,我覺得是非常好的方向,是不是多元司就往這個方向來規劃。
再看大家對於這個資料集,有沒有更多的想法?
如果沒有的話,這個部分就先這樣,我們再往下。有沒有臨時動議?
看各位委員有沒有最後要跟我們分享什麼?如果沒有的話,我們就提早半小時結束,謝謝。
謝謝大家來到第二次會議。很高興看到目前高應用價值的資料已經整理到初步的狀況,今天每個主題報告之後,就可以分別討論。
為了節省時間,我的主席致詞到此為止,直接到列管事項的辦理情形。
謝謝,再往下。