年度百大
中文數位探索:從漢字輸入到電腦中文化的壯闊歷程【博客來獨家作者親簽版】

中文數位探索:從漢字輸入到電腦中文化的壯闊歷程【博客來獨家作者親簽版】

The Chinese Computer: A GLOBAL HISTORY OF THE INFORMATION AGE

  • 定價:640
  • 優惠價:79505
  • 優惠期限:2024年12月31日止
  • 運送方式:
  • 臺灣與離島
  • 海外
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
  • 可配送點:台灣、蘭嶼、綠島、澎湖、金門、馬祖
  • 台北、新北、基隆宅配快速到貨(除外地區)
載入中...
  • 分享
 

OKAPI 推薦

  • 進入「牆後的世界」,從數位與人文接觸的縫隙中找到靈光——《中文數位探索》

    文/董福興,|,臺灣商務2024年12月17日

      近半世紀不到的時間裡,我們⾯對了書寫從類比到數位的變⾰。從持筆在紙上寫字,先轉換到以鍵盤鍵入⽂字,再轉換到觸控螢幕以及更多樣的輸入⽅式。  ⽂字、輸入法在這些數位系統上就像擰開⽔龍頭流出的⾃來⽔⼀般來得如此理所當然。只有很少數的⼈,會因為「字打不出來」、「亂碼」等各式各樣的 more
 

內容簡介

本書所談的是中文電腦史。然而更重要的是,它是通往書寫歷史新時代的初步路線圖。
從「拼音」步入「超書寫」 
數位時代的中文如何從巨大的檢索字盤,走到現今的「超書寫」快速輸入?

  「《中文數位探索》是第一本探討數位時代中文發展史的書籍,以跨越十五年以上的研究為基礎,追溯了電子化中文從二戰結束誕生後,直至今日的繁榮發展過程。這部作品基於口述歷史、實體文物及來自亞洲、歐洲和北美幾十家館藏檔案。描述了包括IBM、中國中央新聞社、RCA、麻省理工學院、中央情報局、美國空軍、美國陸軍、五角大廈、蘭德公司、英國電信巨頭Cable and Wireless(大東電報局)、矽谷、台灣軍方、日本工業界,以及中國大陸的高層智庫、工業和軍事機構中,那些古怪且精彩的人物故事。」

  本書是墨磊寧教授研究漢字從打字機時代到資訊時代的輸入法演進過程的第二本書。承接第一本《中文打字機》的論述,這本《中文數位探索》從1940年代美國IBM公司推出的中文打字機開始談起,談論中文字如何與電腦結合,結合過程當中的各種輸入法嘗試,也會觸及當前數位時代的漢字輸入展望。

  本書要回答的核心問題,是《中文打字機》裡尚未被完全解決的一個大哉問:「如何用一組鍵盤打出上百萬字的中文?」這曾經被認為是不可能的事,卻在漢字化入拼音系統後,在電腦時代達成了。這也造就了當前漢字的廣泛流通。

  在個人電腦仍是雛形的時代,中文輸入就以圖形組成的方式,部首拆分的方式,集結各路菁英的熱情投入,研究出各種各樣的組合輸入方式。也因著QWERTY鍵盤在電腦輸入上成為主流,而使輸入方式聚焦在這有限的鍵盤上,衍生出倉頡、注音、拼音等各種輸入法,對輸入法的研究熱情在華文世界至今仍未休止。硬體的改進也促進了中文輸入的速度,從插入漢卡,到隨著電腦容量與計算能力的激增,一步步打造中文輸入更順暢的世界。

  本書提出中文輸入的六大面向,依時序分章探討,包括自動完成、中文鍵盤、輸入法戰爭、印表機周邊、中文模組化,以及所謂「超書寫」的出現如何衝擊並影響了中文輸入法及漢字的未來。

  另外,作者也觀察到當前中文在網路世界盛行的風潮,以及新一代中國年輕人「提筆忘字」的危機。這兩個並存但矛盾的現象為何會出現?要解答這個問題,就必須回到電腦誕生的時代,探究中文輸入法如何發展演變。

  中文如何克服空前挑戰,徹底改變計算機世界?
  標準的 QWERTY 鍵盤只有幾十個鍵。如何在這樣的設備上輸入中文——一種擁有數以萬計字符、沒有字母表的語言?在《中文數位探索》一書中,墨磊寧著手解決這個難題,並在此過程中發現,解開這個看似不可能的謎題,開創了書寫史上的新紀元──一種他稱之為「超書寫」(hypography)的書寫形式。歷經十五年的研究,這部開創性的漢字歷史描繪了中文數位技術在二戰後的起步,直至今日的多次更迭。

  墨磊寧帶領讀者回顧了中文電腦科學技術的歷史和演變,展示了電子中文輸入法──使用字母數字符號生成漢字的軟件程序──的發展,以及它們對中文書寫方式產生的深遠影響。在這當中,墨磊寧介紹了來自 IBM、麻省理工學院、中央情報局、五角大樓、臺灣軍方及中共最高層(僅舉幾例)一批傑出而古怪的人物,以及他們在開發中文電腦科學技術過程中深入的貢獻,和意想不到的作用。最後,他展示了中國和非西方世界是如何──為了個人電腦革命而不得不發明的超書寫技術──將西方電腦從深刻的偏見中「拯救」出來,使其能夠在美洲和歐洲以外的市場取得一席之地。

  《中文數位探索》是一部引人入勝、敘述精妙的歷史。文化如何影響數位演進,以及電腦又如何反過來塑造文化,對這些感興趣的人都必讀這本書。


 

作者介紹

作者簡介

墨磊寧(Thomas S.Mullaney)


  美國哥倫比亞大學歷史學博士,現為史丹福大學歷史學教授,主要研究方向為東亞史和科技史。他領導的「數位人文亞洲」(DHAsia)是史丹福大學亞洲研究的重點項目。著有《與國家和解:現代中國的族群》、《立國之道:現代中國的民族識別》等作品。

  2018年,他以《中文打字機》(The Chinese Typewriter: A History)(2023,臺灣商務出版)獲得美國漢學界的費正清獎(John K. Fairbank Prize)並入圍列文森獎(Joseph Levenson Book Prize),說明本書備受中國及東亞研究圈高度肯定。本書也榮獲劉易士.孟福獎(Lewis Mumford Award)、《CHOICE》雜誌評選的2018年度傑出學術主題(the CHOICE Outstanding Academic Titles for 2018)以及2020年布里德獎(The Bridport Prize)。

  其著作文章散見於《亞洲研究雜誌》、《技術與文化》、《外交事務》和《外交政策》等雜誌,《洛杉磯時報》、《大西洋月刊》、英國廣播公司都曾刊登他的作品。他也應邀於Google、微軟、Adobe 等科技公司舉辦講座。

譯者簡介

吳國慶


  中興大學外文系,台北藝術大學戲劇研究所畢業。曾任《Hi-Fi Choice》國際中文版副總編輯、《潮人物雜誌》美劇專欄作家,現任醒吾科大商業設計系講師。譯有《我們為何吃太多?全新的食慾科學與現代節食迷思》、《生命的一百種定義:原來還可以這樣活著,探索生物與非生物的邊界》、《電腦如何學會思考?》等書。
 

目錄

致謝
導言:數位時代的中文
1.    當輸入法是一位女性時:IBM、劉淑蓮,以及電子化中文的新紀元
2.    打破魔咒:中文打字機與自動完成的發明經過
3.    告別QWERTY:尋找中文鍵盤之路
4.    輸入法之戰:支秉彝與超書寫的回歸
5.    尋找中國式的改裝:印表機、螢幕與周邊設備的政治
6.    關聯思考:中文進入預測文本的時代
結 語 .歡迎來到超書寫的世界
檔案藏館縮寫查詢
訪問與通訊
詞彙對照表
附註
發表過的文章
圖片說明
參考資料

 
 

導言

數位時代的中文


  可能有一億名以上的中文使用者,遇到了一種奇怪的新型「認知障礙」的困擾。
  他們正在忘記如何「寫」中文。
  至少,已經有這樣的傳言出現。

  這些報導開始於二十一世紀初,每則報導都有著驚人相似的敘述脈絡。一個人在突然之間,從一個能幹、有成就、通常受過高等教育的狀態,例如一位科學家、一位企業家、一位作家,轉變成了像學童一樣,甚至必須努力回憶最基本的中文字。

  因為他們一提起筆卻忘了字怎麼寫:也就是傳言所說的「提筆忘字」1。

  有些人稱之為「失語症」(Aphasia),一種導致無法說話的嚴重疾病。另外一些人則稱之為「書寫障礙」(Dysgraphia),這是失語症的姊妹疾病,不過它是針對書寫而非說話方面。還有人提議這是一種「奇怪的新文盲形式」 2。沒有人能理解這種流行病,其病理與傳統醫學大相逕庭。它的發病如此突然,以至於整個故事就像是直接從科幻小說頁面裡抄來的一樣。

  「失寫症」(Character amnesia)——這是它被貼上的標籤3。

  傳言逐漸演變成了令人警醒的統計數據:根據二〇一三年的一項調查,百分之九十八.八的受訪者宣稱自己有提筆忘字的經歷,其中有許多人每天都會發生4。整個國家似乎陷入了一場奇怪的「漢字危機」中5。

  「失寫症」的龐大影響以及如此令人困惑的行為,都讓情況變得更糟糕。不過,就像許多公共衛生危機一樣,它並未嚴重影響到生活在社會邊緣的人──也就是那些被邊緣化和貧困的人。被這種病無情困擾著的反而是中國的精英階層,一個人越富有、越城市化,就越容易發生提筆忘字的情況;可支配收入越多的人,失去書寫能力的風險就越高。

  罪魁禍首終於浮出水面:數位書寫。「失寫症」最常見於那些使用電腦、智慧型手機和平板電腦的人,也就是由任何使用QWERTY標準鍵盤或觸控板來書寫中文的電子設備所造成。這個人可能前一刻還在筆記型電腦或行動裝置上,穩定輸入長串的文字,然而一旦設備關閉後,他們的思維好像也跟著關閉了。

  我們該如何理解這些驚人的報告呢?這是數位時代的又一個道德恐慌案例嗎──例如對於文本語言、表情符號、手寫能力下降或其他「語言衛生」問題的擔憂?抑或是二十一世紀的中國,已經成為數以億計的新文盲失寫症患者(illiterate aphasics)以及書寫障礙失憶症者(dysgraphic amnesiacs)的家呢?6如果是這樣,為什麼我們在任何地方都找不到這種危機的證據呢?是經濟上出現了缺口?又或許是高等教育的崩潰?果真如此,中國又怎麼可能成為世界上最活躍、最富有的數位經濟體之一呢?此外,中文網路上的活動如此興盛,僅在中國大陸估計就有九億網路用戶參與著狂熱、不間斷的中文內容交流。如果中國最懂上網、最懂技術的人都「無法書寫」(前面提過書寫障礙的基本定義)了,那麼到底是誰在進行這些中文書寫呢?

  《中文數位探索》是第一本探討數位時代中文發展史的書籍,以跨越十五年以上的研究為基礎,追溯了電子化中文從二戰結束誕生後,直至今日的繁榮發展過程。這部作品基於口述歷史、實體文物及來自亞洲、歐洲和北美幾十家館藏檔案。描述了包括IBM、中國中央新聞社、RCA、麻省理工學院、中央情報局、美國空軍、美國陸軍、五角大廈、蘭德公司、英國電信巨頭Cable and Wireless(大東電報局)、矽谷、台灣軍方、日本工業界,以及中國大陸的高層智庫、工業和軍事機構中,那些古怪且精彩的人物故事。

  然而這本書不僅為了展示形形色色的一群失敗者,也致力於解釋中文電腦處理的六個核心維度——理解數位時代中文必須掌握的六個公理。

  為了探索這些公理,我們打算從中國河南省一個寒冷冬日下的禮堂,展開這趟旅程。二〇一三年十二月,也就是「提筆忘字」危機最嚴重的時候,五十五位才華橫溢的數位達人聚集此地。他們聚集的目的並非為了悲嘆「提筆忘字」這件事,而是為了在正面對抗中擊敗對手:亦即在打字比賽中贏得第一名,獲得吹噓自己是中國乃至全世界最快的電腦鍵盤手的權利。

  ……

  在所有電腦和數位媒體裝置中,中文文字的輸入都依賴稱為「輸入法編輯器」的軟體程式—更廣為人知的名稱是「IME」(input method editor,輸入法編輯器,以下簡稱為「輸入法」)。輸入法是一種「中介軟體」,因它們是在用戶設備的硬體與軟體或應用程式之間運行而得名。無論你是在微軟Word中編寫中文文件、在網路搜尋、發送簡訊或其他操作,輸入法都在運作,截取用戶的所有按鍵操作,並嘗試確定用戶想要產生哪些中文字元。簡單來說就是輸入ymiw2klt4pwyy⋯⋯結果就會得到一串中文字。8

  輸入法就像是一種不安分的生物。從使用者按下按鍵或滑動筆畫的那一刻起,它們就開始了一個動態的、反覆的過程,不斷捕捉用戶輸入的資料,並在電腦記憶體中搜尋可能匹配的中文字。目前最常用的輸入法是基於「漢語拼音」—也就是使用拉丁字母來描述中文字的發音。中國大陸的使用者最常使用的就是這種官方的羅馬拼音系統(拼音輸入並非一直都是最受歡迎的中文輸入方式,我們很快就會談到這一點。)。*

  當第一個按鍵被按下(也許是「C」)時,像搜狗拼音、QQ拼音和谷歌拼音這樣的輸入法,就會開始向使用者提供選項。這些「候選字」會出現在螢幕邊緣的彈出式選單中,它們的發音都是以「C」開頭的字,例如「吃」(chi)、「才」(cai) 以及其他上百種可能性。

  當使用者按下第二個鍵(假設為「H」)時,輸入法會調整候選字列表。它開始只顯示發音是以「CH」開頭的中文字元(「才」的可能性被排除了,但「吃」的可能性依舊保留)。一旦使用者在彈出式選單中看到他們想要的字,只需要再按最後一個按鍵—空格鍵、輸入鍵或數字鍵,就可以選到該字,將字添加到主要的文字編輯視窗內(也許使用者想輸入的詞是「chaoxi」,即「抄襲」)(圖0.2)。這種一個接一個按鍵的操作,就是輸入法編輯器如何透過字母、數字與符號,用QWERTY鍵盤產生中文字的過程。

推薦序

漢字進入電腦的漫長歷史,以及其中曲折的人性故事
張俊盛(國立清華大學資訊工程系教授、自然語言處理研究室主持人)


  拼音文字幾乎是語音的孿生姐妹,學習起來容易,也容易排列檢索。相對地,漢語的象形文字就很難有簡單的排列、檢索的安排。在電腦發明之後,這個差異更顯得突出:漢語或者中文,遲遲無法和人類歷史上最重要的工具發明結合。使用者很難把資訊傳入電腦處理(這就是所謂的「中文輸入法」),在電腦中表達中文資訊。

  出乎一般人認知,漢字其實某種程度上是非常倚重「音」的訊息。雖然漢字有六種構成的法則(六書):象形、指事、會意、形聲、轉注、假借。其中,會意字在說文解字中有一一六七個占十二%,數量比象形、指事為多。其實,最多的反而是形聲字,但語音卻無系統的借用「漢字」來表達,不像羅馬文字用26字母有系統來表達聲音。

  雖然,我也提出一項中文輸入法的專利(多重模式注音符號碼之解碼裝置, 發明專利第00181367號,證書號056598,中華民國專利公報,十九卷,十期,一九九二年四月一日),執行過倚天公司委託的中文輸入法研究案。我對中文輸入法所知受限於台灣,也受限於個人電腦的世界。墨磊寧教授的這本書讓我大開眼界。

  本書詳細敘述漢字進入電腦的漫長歷史,不僅僅有技術的層面,有各式各樣的圖表,影像:從大鍵盤、形象代碼、語音代碼、對應到英文鍵盤、儲存為內碼、紀錄字型的艱辛過程。我特別欣賞他講故事追新聞的功力。比如說,他描述IBM展示中文電腦的新聞照片,圖中當然有風度翩翩但有點緊張的發明人高仲芹。展示成不成功,其實有賴熟練地操作電腦鍵盤的一位搶眼年輕女士。墨磊寧教授當時已經認識了高仲芹的專業聲譽和家世,但是不知道這位女士是誰。身為一位歷史教授,他自然想知道她的名字,了解背後的故事。書上描述教授歷經了十年功,居然找到她――第一位中文電腦打字員葛瑞絲.湯(Grace Tong),接著就是一段動人的故事。

  高仲芹用電華打字機寫給IBM總裁的第一封中文信:

  日期:一九四六年二月二日

  親愛的華生先生:

  由於你的遠見和慷慨支持,讓我有幸使用這台打字機,寫下有史以來第一封中文打字信件給你。

  其實,照片上的年經女士另有其人,就是出生在廣東,遠嫁美國的劉淑蓮。讀到這裡,讀者妳可能已經了解到這本書同時間紀錄了一項偉大的科學發明和突破,以及其中曲曲折折的人性故事。

  他追溯IBM要讓電腦中文的起點,搜集了美中台三地,甚至是日本的漢字電腦化的研究開發,鉅細靡遺,娓娓道來,令人動容。

  最後,我也來談一下我個人的中文輸入法故事。補充一下這本的台灣部分,希望不是狗尾續貂,或許勾起大家台灣的回憶,重回中文輸入法風起雲湧的時代。我來談談台灣的中文輸入法的場景,我熟識最要角:倚天、松下、朱邦復、許聞廉。

  日本當然很需要日文電腦化,因為漢字也是日文的三種字體之一,日文電腦發展的歷程也影響到台灣。日文早期也有大鍵盤的漢字打字機。之後,就朝向漢字讀音的輸入法,可以羅馬拼音或直接用仮名(平假名、片假名)輸入,透過選字、選詞。這時候如果能用語言模型就可以排列選擇,預測最可能的選項。松下公司的台灣分公司的周峻慧,繼而在台灣用同樣的想法,開發「漢音輸入法」是當時第一個拼音/注音的智慧型輸入法,廣為大家所愛用。當時內建於宏碁與微軟、資策會合作的中文 MS-DOS 3.21 版中。之後,中央研究院的許聞廉研究員,也開發了「自然輸入法」,用人工撰寫的規則表達詞語前後的搭配關係,來強化預測的準確性。

  朱邦復自一九七七年開始因為參與軍方發展中文通訊系統,而投入研究漢字的檢索問題,從傳統的「部首、筆畫數」出發,設計了「形意檢字法」,後來演變成家喻戶曉的「倉頡中文輸入法」。倉頡簡化部首為二十四個「倉頡字母」來配合電腦鍵盤的二十四個英文字母。非學院派的朱邦復不拘泥於文字學家對部首的認定,而是直覺地由「上、左、外」而到「下、右、內」順序,來分解漢字、簡化部件、處理例外,編製一字一碼,互不重疊「倉頡碼」。

  「倉頡碼」有顯著的優點,合乎直覺、易記、易維持之效。首先朱邦復透過巧妙的設計,達到一字一碼,不用選字的效果。然而,初學者無法做到「想打」想到一字,馬上浮現「倉頡碼」馬上打字。不過,「倉頡」經過短時間的學習,就能上手,最後達到盲打。

  在中文電腦,中文輸入法風起雲湧的時代,許多人都技癢,想要有所創新有所貢獻。筆者那時開始在清華大學資工系執教,就因緣際會設計了一套中文輸入法。我在清華的日子教學研究之初就滿腦子實務應用,沒用心在學術發表。即使在學術發表有進展,也都是發表一些輕量級的demo papers,枉費我在 NYU苦學了那麼多理論。其中一項業外收獲就是中文輸入法的專利。我成功獲得中華民國專利,並且得到國科會補助專利申請費用。後來,有機會得到倚天公司委託,繼續研究中文輸入法。但是,這一項專利一直束之高閣,沒有化成產品服務社會。

  二○二○年一月,有一天安裝了新版蘋果作業系統、輸入法後,突然發現自己宛如夢裏,試用起自己發明的中文輸入法,一方面高興,一方面也難以置信。近日受臺灣商務印書館之邀,為本書執筆做序。便翻出我的中文輸入法專利,來自娛一下

  申請專利範團:

  一種多重模式注音符號碼之解碼裝置;多重模式注費符號碼將中文調以多種方式編碼,即

  1. 詞的全部讀音
  2. 省略末字以外的非首音符號(及/或四聲)
  3. 省略每字的非首音符號(及/或四聲)

  皆可視為一中文詞的注音符號碼;

  解碼裝置包含下列步驟:

  (a)初期化,設定堆疊為起始處理狀況
  (b) 取出堆疊頂端記錄,並判斷是否成功
  (c)若成功,則由代碼記錄的最後位置往檢查,找到可以構成一字的首碼或全碼符號,記錄新的代碼間隔及目前編碼模式
  (d)若有多種構成一個字的首音或全音符

  專利文長,就不贅述。總之,我們有幸讀到墨磊寧教授的中文電腦的壯闊歷史,科技人的苦苦追尋解答的動人故事,台灣、日本、美國、中國很多人一再嘗試,這些一時豪傑都有階段性的成功,他們的解決方案,都有眾多的追隨者。隨著技術的推進,前人嘗試被無情地取代。中文電腦的技術,不受限於使用漢語的台灣、中國、日本,美國也扮演了相當重要的角色,就像在容量很低的 IBM PC電腦的擴充槽,插入漢字字型卡的方式,就是出自一位美國年輕人的構想。
 

詳細資料

  • ISBN:4710356240109
  • 規格:平裝 / 400頁 / 17 x 23 x 2.4 cm / 普通級 / 單色印刷 / 初版
  • 出版地:台灣
 

內容連載

結語(摘文)
 
雖然英語世界確實有一小部分人,從一九八〇年代就開始質疑QWERTY鍵盤的神聖地位,甚至有人呼籲廢除它。但除此之外的拉丁字母世界裡,有更多的人在一百年前開始就這麼說了。早在一八八〇年代(不是一九八〇年代),語言改革者、技術專家、國家建設者以及跨越現在的東亞、南亞、中東、北非等地的人,就已經開始提問:我們該如何克服QWERTY鍵盤的阻礙?20
 
來自非西方對QWERTY鍵盤的批評,其所涉及到的利害關係,遠比大衛等人著作中所表達的更為深刻。大衛抱怨由於QWERTY鍵盤的佈局,讓人每分鐘損失了幾個單字的輸入速度。而戴蒙只想從他的鍵盤上榨取更多潛力,以減輕手腕的負擔。與此同時,中國評論家則在爭論以QWERTY鍵盤為代表的鍵盤介面,以及其他以拉丁字母為中心的資訊技術,是否會將中文寫作完全排除在全球科技語言的現代化過程之外。日本、韓國、埃及、泰國、印度等地的改革者,則是擔心他們文字文化的命運,亦即擔心他們國家的未來。

最近瀏覽商品

 

相關活動

  • 【人文社科】感電出版全書系 任選2本82折,打主書《鋰戰:全球儲能競賽的未來真相 (電子書)》
 

購物說明

若您具有法人身份為常態性且大量購書者,或有特殊作業需求,建議您可洽詢「企業採購」。 

退換貨說明 

會員所購買的商品均享有到貨十天的猶豫期(含例假日)。退回之商品必須於猶豫期內寄回。 

辦理退換貨時,商品必須是全新狀態與完整包裝(請注意保持商品本體、配件、贈品、保證書、原廠包裝及所有附隨文件或資料的完整性,切勿缺漏任何配件或損毀原廠外盒)。退回商品無法回復原狀者,恐將影響退貨權益或需負擔部分費用。 

訂購本商品前請務必詳閱商品退換貨原則 

  • 投資理財書展
  • 年末電影展
  • 皇冠全書系