網站上有的,大概多少都有看過,之前就有看過一些包含紙本,政府這邊有盤點一些社企,也出了一些小冊子等等,文字的部分都看過了,但是故事的部分可能就要……
對,要很好的小肌肉控制。
這已經是標準,所以現在開始的採購案就適用了。
非常好。
我想確實,因為之前比較沒有人把這幾個拼起來,主要是因為法規命令不完備,但是隨著去年「勞工在事業場所外工作時間指導原則」、「行政院及所屬各機關政府資料分類及授權利用收費原則」,這一些慢慢頒布之後,目前至少公部門在開放政府資料(Open Government Data,簡稱:OGD)的部分有一些原則。
當然,我們不敢管到產業界如何開放他們的資料,所以當政府在講「開放資料」的時候都是在講「Open Government Data」,這個必須要先講在前面。
所以至少OGD現在的enforcement,我們不是靠公務員來做labor intensive的事情,那不是一個很恰當運用公務人力的方式。同樣的,我們不會因為要開發AI,就要公務員開始去一項項label資料。
但大家確實看到這是趨勢,其實我們慢慢會透過幾個方式來做。一個是公部門本來就有「青年學生公部門見習」的計畫,那是公部門作為需用的機關,可以讓學生來這邊見習跟上班。
之前都是實體來,每個機關通常都只用一、兩人,因為座位就這麼多。我們這一次作了革新,我們跟教育部青年署辦這一個計畫說我們一次要十五個人,他們覺得一次要的有一點多、辦公室是不是坐得下?我們說一開始有training、之後可能偶爾辦meet up,可是絕大部分的時間他們是在家裡,或者是網咖,或者是要在哪裡都可以。
他們要做的事情,誠如您所說的,就是幫忙公部門……一開始還沒有做開放資料,只是先檢視公開的資訊,舉例來說在iPad上會亂掉或者是排版有問題,或是只能用Windows、只能用IE開。
這些同學們如果會寫程式更好,那不只看到問題,而是能建議資訊機關如何解決資訊可用性的問題,所以我們會分兩組:一組是找問題的,一組複核跟解決問題。
這個也算是眾包(crowdsource),我們先試這一個流程。因為PDIS畢竟是規劃單位,並不是執行單位,所以大部分做事的方法是小規模pilot一次,做完之後會整理成公部門如何運用大量學生來眾包的流程。
至於各部會接下來要拿這一個流程做資料標記或做什麼事,都是各自去執行,這個流程都已經分享給各部會了。大概就是這樣子。
現在想要叫……
英文是什麼?
喔!青年救國,RAY……(笑)。
這樣就變成GWRay,不是X-Ray(笑)。
「Extreme Rescue Action by Youth」(笑)
總之,現在在試這樣的計畫。我們的想法是非常簡單的,結合了電傳勞動、眾包及一定程度目前還是公開資訊,未來也不排除會和開放資料有關聯。
我們有三個單位一起合作。
他們同時也負責規劃政府資訊開放、Web呈現,跟Open Data的呈現。
但是他們測的時候,他們也提出其實並不會特別為了這個去買iPad或Mac,所以其實Safari常常沒有測到,可能就只測IE跟Chrome。這個就是我所說的非常labor intensive,這其實不應該叫公務員做的事情。
是,資料品質也是同一個單位處理。
我覺得有一個很簡單,你們有登錄在社企上,其實公部門現在有在做共同採購,你們知道這一件事嗎?
我把網站開出來,這樣比較容易說明。
是,這個是我們剛剛講的背景。目前中企的社企專區有一個資料庫,內容是之前那一個,搬到這一個網站來( http://sme.moeasmea.gov.tw/startup/modules/se/ ),只要在上面有登錄的社會企業,目前是適用三個不同的專案。
「社會創新實驗中心」是我們每個禮拜去一、兩次的空總的專案。
另外,像你們這邊有提供政府機關資料清洗服務,或者是我剛剛講的網站抓蟲校對的某種服務,其實也可以適用這樣的規範,而這個規範基本上的目的是中小企業處會去把社企所提供的這一種服務——當然產品也可以——制訂一個規格,然後訂一個合理的價格,幫忙去撰寫這一個招標文件。
這一個東西的特性是,只要有兩個以上的機關都表示需要這一種服務,這樣的話就不受10萬元的限制,就可以整批的人買,等於變成共同供應的vendor。
當然這部分對於有些社企的履約上也會產生一些壓力,因為以前他們可能習慣比較小規模的提供,但是進入共購之後,可能會有比較大的案子來,但也要消化得了。所以在這邊也有每季追蹤的情形,如果其實量真的只有這麼多的話,我們就要先講清楚,不要造成機關覺得可以一次採買一萬五千個的情況,雙方都會設立一些期待值。
這梯是實驗,大概到12月底,但是第二至四梯次,如果這一個實驗,大家覺得ok的話,就會繼續run,所以任何時候,讓中企處知道這件事的話,大家就會持續進行。
對,只要在登錄資料庫裡面,中企處就幫忙輔導你,把服務或者是產品加到共同供應契約。
對。
這個不需要中央政府做,地方政府非常活躍在做這一件事,也就是所謂的「滿城盡是黑客松」。
現在各種需用機關,從嘉義、台北、高雄到台中,你想像出來的,只要有任何資料的清洗、蒐集、應用,及包含國營事業的台電、台水之類的,他們經常會辦黑客松,只要一、兩個團隊,他們建立一個長期的關係之後,其實常常就會一直辦下去。
這個我覺得已經非常熱了,我們不需要再去加溫,已經沸騰了。
沒有錯,只要找「資料黑客松」就可以找到一大堆。
像發展AI,其實不一定是labor intensive,那個也需要研究。
像我們現在缺的、幫忙做研究的朋友,科技會報目前主要在推RSC,來幫忙解決某些可能在法人裡面這一件事排序比較低、要等比較久才能解決的一些研究工作。
像科技部接下來也會有一些challenge,就是對整個公部門來講,為了發展AI,就是要先解決這些技術問題的那一些部分,就會辦challenge來解決。
這些比較不那麼labor intensive,所以我剛剛比較沒有提。
對,我覺得這個很好,好比像以grand challenge來講,我不確定這會不會是第一個,但是我們之前在討論的時候,其中一個我們自己覺得最labor intensive的題目,就是這位朋友(Wendy)正在用一分鐘三百字的速度在打逐字稿的事情。
其實在這方面,在英文幾乎已經可以應用的某些情況,中文現在還要用比較特製的麥克風陣列,才可以把語音轉文字做好。這個落差我們可能就會想要用grand challenge的方式縮短。
這裡面有包含有一些是labor intensive,就是我以前在業界幫忙做的一些題目,要去每個的地區蒐集acoustic model,又或者是同一段台語的字,要想辦法讓不同腔調的,像講漳州腔、泉州腔的朋友們,除了用高雄優勢腔唸過之外,也要找各種不同的腔調唸過。
但即使你有這些素材,沒有好的演算法,還是不能做出一個好的語音識別模型。所以,我覺得這兩個確實在某些題目上,像語音識別,是可以搭配的。
再一陣子會公布。其實作為政委,我們只是幫部會發想一個大方向,並沒有參與什麼執行細節。
我覺得不管未來的題目是什麼,都有兩個目的:一個是教育目的,也就是讓學生們知道,事情不一定都要用老方法來解決,也可以用創造新的方法來解決,這方面可能會跟高中生、大學生有一些互動。
第二個,確實也要培養新的研究服務團隊,這也是真的。
除了國營事業以外,地方政府的題目永遠比中央政府多,像打到1999陳情也好,都是離大家的生活比較近。