10,000 篇臉書文之後

已簽名
已簽名資訊

豆泥的以太坊地址: mashbean.eth

狀態: 已驗證

文章的身分證字號

0x018727940b2f47659478d554d11f2853dd655accf601e6ab52a3263c4a71442a

這是什麼?

已簽名表示這篇文章已建立獨特的身分證字號(內容雜湊,contentHash)並且由豆泥簽署認證,簽署是採用以太坊區塊鏈的豆泥專用地址(signer.mashbean.eth)。只要內容一經修改,就會需要重新驗證換發新的身分證字號。但豆泥不是每天都在公所上班,所以偶爾會慢一點認證。

閱讀偏好
10,000 篇臉書文之後

現在好像正在愚者之巔(達克效應中,學會一點東西就嘰嘰叫的狀態),但這種快樂、輕鬆、小步奔跑的感覺真好,所以還是想要記錄下來。

這次想要記錄的是提升人肉效率的歷程,身為超級懶,喜歡動嘴不動手,又很喜歡沒事做檢討大會的人來說,現在這個時期真的是最美妙的時刻。

第一層加速

在下載了 17 年 10,000 篇臉書貼文之後,下一步當然就是要確認這些文章哪些值得放上部落格。但一萬篇文章,要一篇篇挑出來實在是很可怕的工作,於是我歪腦筋就動到 AI 身上。

它先幫我過濾掉一大部分顯然不需要上稿的貼文,比如沒有文字的分享貼文,然後便自動幫我分類成 A、B、C 三類文章,說我只要判斷 A、B 兩類就好。A、B 兩類文加起來約有 1,000 篇。

我的想法是 A、B、C 全部都放上去,但只有真正的精選文可以在首頁、標籤頁找到,其他只能用搜尋的。但看到 1,000 篇這個數字,又覺得好懶,可是又不得不自己審稿,因為有些文章比較敏感,不應該公開。

第二層加速

於是我就想說,如果可以弄一個介面,像 Tinder 那樣左滑右滑,豈不妙哉,這樣就不像工作,而是像大量的「年度回顧」了,聽起來挺有意思的。

於是我就囑咐 AI 研究一下這思路,沒想到才「三分鐘」後,竟然就吐給了我一個熊讚的介面(如圖),讓我可以懶人式的一路點下去,判斷哪些文章棒,哪些不納入。

這讓我驚呼不已!

雖然這只是個簡單的 html 頁面,但使用者設計絕頂好呀,該有的功能都有,顏色也巧妙的聚焦在要不要納入這件事上面,下面還可以看到各篇文章的狀態。怎麼三分鐘就可以生出這個絕贊的工作用 UI…。

第三層加速

於是我就快樂的判斷了約莫 150 篇文章,大約耗費 1 小時左右的時間,一邊看一邊 EMO 了起來,看到十年前的文想說自己怎麼這麼屁孩…。這大幅度的降低了我的工作效率。

於是我又想到,啊我都手動標記了這麼多了,AI 能否幫我根據我的標記風格,來幫我判斷剩下的。

於是我又多標了 80 篇,把 A、B 兩類都標了些樣本。其實 AI 一開始就分類的不錯,B 類納入精選的比率遠低於 A 類。最後一步就是我請他根據我的標注樣態,分析「年份」、「字數」、「關鍵字」、「內嵌連結性」,還有「我不知道的文章屬性相關性」,來進行分類。

沒過幾分鐘,它就幫我把剩下 800 百多篇文章分類完了,而且分類的很不錯。而且更棒的是,「貼心怪」 AI 又多做了一組還需要我自己判斷的灰色類別,剩下 100 篇左右,我就當仁不讓的把這些文章手動標記完了,納入比例還真的介於原本的 A 類與 B 類中間。

真是颯爽。

弄完分類以後,發現 AI 有幫我整理了兩次的分類原則,流程上挺有意思的,直接用第二版原則來分享。

流程上是他抓到了一定的規則,大於幾分就納入,小於就不納入,剩下的給我審核。分數的依據是根據,字數有沒有多於 1,800 字、句數有沒有多於 45 句、結構訊號(應該是有沒有連結)、年份精選率、以及主題訊號(它寫說判斷臨床類加分、純轉載內文扣分)。

更讚的是還根據我的最新標註做了回測,說精確率來到了 93%。我想說這種對我來說已經有點複雜的判準流程設計,為何它可以在蓼蓼數分鐘內完成,那「數位人文」的學門是不是以後可以光速進化了…(遠目蔣介石日誌)。

以前有一說是,「勤勞的聰明人」適合做幕僚,因為他們會一直處理問題;而「懶惰的聰明人」適合做老闆,他們會去思考流程與結構;「懶惰的愚者」擺著不用擔心,他們雖然慢,但不會造成什麼問題;而「勤勞的愚者」需要趕快開除,因為他們會替所有人造成麻煩。

不好意思說我一直覺得自己超級懶,對於重複動作可說是深痛惡絕。所以有了勤勞的聰明 AI 之後,根本就是「懶惰的聰明人」的神藥。

我覺得我能在短短的時間內,從第二層加速(tinder 類小工具分類海量文)再到第三層加速(從人工標記反過來更新自動標記),就是因為我是真正的懶蟲,一點都不掩飾那一點點兒都不存在的勤勞。

而且大前提是,我真的沒上過機器學習、演算法、資料結構之類的課,相關專有名詞也幾乎不會,只是有那一點點的 taste 而已。但這樣的狀態竟然能在一頓飯的功夫解決萬篇文章的分類,我實在痛哭流涕。

是以為記,希望達克效應發作久一點,多留一點紀錄,不然之後就會不好意思寫了。

← 回文章列表