1468 字
7 分鐘
Blog始業式:為甚麼要寫Blog

我是誰?#

Hi, 如果你有看到這一篇文章,沒意外應該是只有兩種可能:

  1. 你是我朋友
  2. 不小心點到這個網站的人

如果是認識我的人,我相信我不用自我介紹;如果是不認識我的人,我相信我也沒必要在這邊自我介紹。假設你對於我這個人很感興趣,可以點選關於去了解我是誰。用一句話總結我這個人,我覺得可以這樣總結:「我是一名資工人,但不只是一名資工人」

為甚麼想寫blog?#

正如前面所說的,我是一名資工人。其實白話一點說,我就是一個目前就讀資訊工程學系的學生。我在高中時決定要走電腦科學這個領域,迄今以來已經八年了。我不敢說我是一名天資聰穎的人,上天並沒有授予這樣的恩惠於我。所以在這八年多來,一路上都磕磕碰碰的,能夠一路走到今天這個地步,完全不可否定受到許多人無私的幫助。正如我平常開玩笑地說:「每個資訊圈的人都一定有被印度老師教過。」曾經為了解決一個語法、環境或神奇的電腦問題,在無論是stackoverflow、reddit或github上亂逛的故事,相信數不勝數。也因為如此,曾經受過網路上素昧平生的網友的協助,所以我也想要成為另一個帶領別人踏入這個領域的人。

前面所講的動機,是我大約在四年前,想要去寫iThome的時候所想的事情。在過去的幾年內,有一項工具改變了我們所有的工作型態,那就是大型語言模型。相信不只有我,在大型語言模型(如:ChatGPT)發展成熟之後,其實有很久的時間沒有再去從零開始去找資料。有時候可能直接問ChatGPT就會尋求到我想要的答案了,我也已經不知道多久沒有打開過stackoverflow了。那,為甚麼還要寫?其實這個事情在我心中糾結了很久。到了最近踏入研究所之後,我發現到一個現象。雖然ChatGPT很好用,但是很多人還是需要有人引導如何去問ChatGPT問題。再者,大型語言模型幻覺的問題,到現在還是沒有徹底解決。作為一名人類,我們其實需要適度地去辨別大型語言模型給我們的答案是不是真實的,這也是為何我現在決定開始這項任務。

還有其他原因嗎?#

有,當然有。前面所講的只是一個起因,但是當然並不完全。作為一名機器學習的研究者,如果想要模型訓練的好,資料量必定要大。這也是每個機器學習任務的第一項工作:收集資料。沒有資料,就沒有模型;沒有資料,就不能訓練。也因為如此,大多數語言模型在訓練時,主要都是以英文為最主要的語言。這其實也不令人感到意外,畢竟網路上英文資料就是最多的,並且英文的編碼以及邏輯相對來說比較簡單。如果真的想要收集中文的資料,通常也會以中國的資料為主。這也不是很令人感到意外,畢竟中國就是人多,自然能夠撰寫資料的人也比較多。不過這也產生一個結果,大型語言模型在講中文的時候,就只會使用中國習慣的用語或文法。這也使得模型有時候輸出中文時,會讓我感到十分的困擾,甚至曲解他的意思。我相信我不是第一個有這樣困擾的人,但是訓練資料的缺乏這確實也是一個不可避免的門檻。也因此,我想要拿起我的鍵盤,開始用臺灣國語撰寫下許多文章,希望在未來能夠為這一個大數據提供杯水車薪般的資料。如果只有我一個人寫,一定有如蚍蜉撼樹,如果也能因此帶動一些人也一起坐下來寫作,在未來的某一天必定能夠產生足夠多的資料。

除此之外#

在前面講了兩個十分高大上的理由以外,其實就是我想要找個地方可以發表我自己的看法。但是我又不是很想要我所有的東西都塞在我個人的社群平台,這樣看起來資訊會十分蛇龍混雜。再加上如果動不動就發一個千字文,我覺得我身邊的朋友會覺得我有點瘋瘋的。這時候如果建立一個blog的話,就可以盡情的在上面亂嚎,也不會打擾到我日常朋友的社群頁面!根本是一舉兩得!所以,不要讓社群平台蛇龍混雜,就來讓blog蛇龍混雜吧!所以這上面可能有時候會分享一些技術文章,也可以會打各類的心得,甚至我現在有考慮來寫一篇研究生生存紀錄XD。希望能夠藉由這個blog讓我的想法與能力能夠被傳達出去!

結語#

如果你完整地看到這邊,恭喜你看完了一篇一千多字的文章了!不過這畢竟是這個blog的第一篇文章,所以想講的話有點多,所以也很感謝你看完這篇文章!

讓我們一起期待下篇文章的出現!我們下次再會!

Blog始業式:為甚麼要寫Blog
https://ase12345636.github.io/blog/posts/first/
作者
Terry
發佈於
2025-11-20
許可協議
CC BY-NC-SA 4.0