2013年12月12日星期四

字母

世界上除漢字、彝文字和瑪雅文字外,幾乎所有語言的文字,都可上溯至腓尼基字母、烏加里特字母和古埃及象形字的後代。那麼,他們的排列次序當然也大多一致。

舉例來說,羅馬字母中間七個字母的排列是 O P Q R S T U / o p q r s t u,希臘字母則是 Ο Π Ϙ Ρ Σ Τ Υ / ο π ϙ ρ σ τ υ。(現代希臘語已不用字母 ϙ 了,英語的 Q 也很是多餘。這是後話,容後再談)

寫法方面,希臘字母和羅馬字母已經不太相似了,但希臘字母與基里爾字母(俄語等語言用的),外貌還比較相似甚至相同。例如希臘字母的 Ρ / ρ,和基里爾字母 Р / р,對應的都是羅馬字母 R / r。希臘字母的 Υ / υ,和基里爾字母的 У / у,對應的都是羅馬字母 U / u。

但是為什麼只是大多呢?因為有些發音,某些語言沒有,當其他語言需要那個音時,唯有在字母表後面添加上去。有些字母比較早加上去(如 u),所以後來不少文字都有該字母。腓尼基字母最後的字母,只是去到相當於其他字母的 t。

至於羅馬字母,誕生自約公元前7-前6世紀。意大利的伊特魯里亞人,把希臘字母改做成他們的文字,繼而再成為羅馬人的文字。

伊特魯里亞字母是:A B C D E F Z H I K L M N O P Q R S T V X。

起初字母 C 是同時代表 g 音和 k 音(希臘字母的第三個 γ 只代表 g 音)。後來因拉丁語沒有 z 音,就把 Z 這個字母踢走,另設一個字母 G 放在本來是 Z 的位置。

及後因為要分辨發音,在羅馬字母裡出現分化,例如由 I 分化出 J(半元音)。至於 V,它原本是當作現今的 u 用,後來分化了 U 和 V,然後到 W。

拉丁語後來引入了很多希臘語詞彙,於是加入了 Y 作為字母,放在 X 後面。然後也重新引入一次 Z,不過由於原本排第七的位置被雀巢鳩佔了,所以唯有默默放到最尾。

很多西歐語言中的 Y,都不是讀若英語的「歪」音。拉丁語叫「i Graeca」,法語叫「i Grek」,都是「希臘的 i」的意思。Z 也如此,拉丁語、西班牙語等,都叫作「zeta」或「seta」(cf. 希臘字母 ζ zeta)。英語和法語縮短了一個音,變成「zed」。

香港地名謬誤

(1) 荔枝角鐵路站位於長沙灣,不是在荔枝角。

(2) 藍田站也不位於藍田。藍田站位於茶果嶺/茜草灣一帶。

(3) 銅鑼灣站位於一個地方叫鵝頭嘴,英文 East Point,直譯就係東角。於是,崇光百貨後面有條街,就叫東角道。天后站才是位於銅鑼灣。現在希慎廣場附近的地方,曾稱為鵝頸區或寶靈城。

(4) 港鐵沒有沙中綫,只有一條東西走廊,連接屯門←→紅磡←→鑽石山←→大圍←→烏溪沙。後來稱屯馬綫。

(4A) 在東西走廊中,有土瓜灣站和馬頭圍站。土瓜灣站位於馬頭圍,而馬頭圍站則位於土瓜灣。死未。通車時已經更正

(4B) 馬頭圍道與荔枝角道有樣嘢好似,就係用來命名街道的地名,是在路的盡頭。荔枝角道由荔枝角一直伸延至旺角(始創中心對面),馬頭圍道由馬頭圍一直伸延至紅磡,途中經過土瓜灣。港鐵東西走廊的馬頭圍站,正正就位於馬頭圍道中間的土瓜灣。如果以此改名邏輯,咁始創中心響荔枝角道旁邊,係咪又叫位於荔枝角?!

(5) 香港大學本部,亦係類似情況。香港大學本部位於龍虎山山腰,並不在薄扶林。薄扶林道只係一條通往薄扶林的馬路,但正如荔枝角道的頭段在旺角、大埔道的頭段在深水埗一樣,薄扶林道的頭段,並不在薄扶林。

(6) 很多人以為牛頭角站改錯名,其實往時的牛頭角,正正是位於現時馬蹄徑附近。康寧道以西不叫觀塘。

(7) 理工大學並不位於紅磡。理工大學向來都是在尖東,除了它最新的宿舍之外。什麼地方是紅磡?東西走廊(屯馬綫)的何文田站。

(8) 灣仔消防局並不位於灣仔(灣仔和鵝頭嘴/東角,以堅拿道為界)。在灣仔的消防局,叫港灣消防局,英文叫 Kong Wan Fire Station。

(9) 旺角與油麻地,以登打士街為界。油麻地與尖沙咀,以柯士甸道為界。位於登打士街56號的柏裕商業中心,有 n 咁多間手機維修中心的地方,實際上不位於旺角。最搞笑係九巴在彌敦道一個叫「油麻地寶靈街」個巴士站,對面馬路個站竟叫「『尖沙咀』德成街」。

2013年7月7日星期日

中國語文的文字和讀音

中國語文有兩個博大精深的部分,一是文字,二是讀音。

首先是文字。世界上幾乎所有語言的文字,都可上溯至腓尼基字母 (Phoenician alphabet) 和與它相關的烏加里特字母和古埃及象形字。

只有漢字、彝族文字和馬雅文字(已無人用)是例外。日語假名則來自漢字。

至於朝鮮文字,聲稱是世宗王創制的「訓民正音」,事實上,朝鮮文字是來自蒙古的八思巴文,八思巴文可追溯至藏文、可追溯至印度文字。所以朝鮮文字也是腓尼基字母的後裔。

正因如此,世界上只有中國語文,才為怎樣翻譯外國事物和化學元素,而大傷腦筋造字。其他語言,十居其九點九九,都是把一種字母轉換成另一種字母,就叫翻譯完了。

第二是讀音。我們可從出土文物中,可知道四千年前的文字。但是讀音,卻要到1877年發明留聲機之後,才能原汁原味保留。所以幾千年間,讀音只能靠各種煩瑣又古怪的描述來記載,直至魏晉時代,印度梵語隨佛教傳入中國後,才產生出較為科學的反切。

外國文字由於以字母書寫,所以它們的發音是很直觀的。像英文讀音不跟從拼法的,是絕對的異數。中國文字由於不是字母,研究古時漢字是a怎樣發音,在近一百年才獲得長足的進步。

文字和讀音,是中國語文的兩大組成部分。可惜,中國語文作為一個學科,卻對這兩方面,輕輕帶過就算。

有很多本來可以靠研究文字和研究讀音,便可科學地得出結論的東西,到了學校裡的中國語文科和中國文學科,就變成死記硬背,讀後也不知其所以然。另一個例子,就是一些學校,熱衷用普通話教中文。我要鄭重指出的是,這正正是對學習中國語文的一大障礙!

2013年7月6日星期六

鳥獸蟲魚,與爬虫

古時中國,對於動物,只有鳥獸蟲魚四類。用腳走的是獸,爬的是虫。

所以對於蛇、蜥等,因為是爬的,部首也从虫部。

爬行的動物也分兩類,有腳的是虫,無腳的是豸 (音治)——《爾雅》。所以嚴格來講,蛇是豸,蜥蜴檐蛇是虫。

豸既是爬蟲類的總稱,為什麼貓、豹、豺、貍等字是豸部呢?說文解字:「豸,獸長脊,行豸豸然,欲有所司殺形。」即是,以皃取物也。

皃是今貌字,貌是皃加上無謂邊旁而成。但是,就不見大陸要簡化此諸多筆畫的字,改回它原本的樣皃。

2013年7月5日星期五

木林森,虫䖵蟲,水沝淼,火炎焱

來一趟說文解字。

「森林」,有五個木字,表明多木。

同樣,「䖵蟲」,首字係[虫虫]。所以它也有五個虫 (音毀,huǐ) 字,當然是虫多了。

䖵,又寫成同音的蜫。 䖵蟲就變成蜫蟲了。現在見到的昆,又只是前者的一個同音字。

一條是虫,一大群就是蟲了。正如木林森一樣。

火: 二火為炎,三火為焱。焱同焰,火焰,火花。

水:二水為沝 (音捶),三水為淼 (音渺)。

淼,大陸稱淼是渺的異體字,其實只是說對了一半。渺沒有淼原來多水的意思。

2013年5月9日星期四

ISBN 漫談

ISBN,全寫為International Standard Book Number或「國際標準書號」,在1965年誕生,用作對書本的識別碼。ISBN本為10位數字,從2007年元旦起,提升至13位數字,兼容「國際商品編碼」(前稱「歐洲商品編碼」,即EAN,俗稱bar code)。

10位數字的ISBN分為4部分,
(i) 首部分為語言或國家編碼,之後
(ii) 為出版社編碼,然後是
(iii) 書本編號,按出版或登記的順序排列,而
(iv) 最後一位數字為核對碼。

至於13位數字,則在10位數字前,加上 “978” (或“979”,容後解釋)。另外最後一位即核對碼的計算方法,因要與EAN兼容,計算方法與10位ISBN有所不同。

「語言或國家編碼」方面,長度可由1位至5位不等。起初有ISBN時,是以書籍的語言來分區,0或1是英語書,2是法語書,3是德語書,4是日語書,5是俄語書。

因為以語言為分類,難於管理,所以就將號碼分別派回各個國家。例如7是中華人民共和國,89是韓國,960是希臘等等。至於以前定下的語言編碼,4字派回日本,5字派回前蘇聯,至於0或1、2、3,因有多個國家採用同一語言,要查閱對照表方知道究竟某個號碼屬於哪個國家了。

香港起初的編碼是962,用罄後新增一個編碼988。台灣起初的編碼是957,用罄後新增一個編碼986。澳門在回歸中國前,書籍的編號採用葡萄牙的972,回歸後獲編編碼為99937(因為出版量少,只獲派一個範圍少的編碼),不久之前新增一個99965。新加坡起初的編碼是四位數的9971,後獲派編號為981。

香港的編碼是 962 和 988,都是 3 位,即係話,香港出版社編碼 + 書本編碼就等於 6 個位了。

有些出版社規模大的,分得 2 個位編碼,於是,書本編碼就可編 4 個位。而最小的,出版社編碼係 5 個位,即係話,書本編碼只得 1 個位。

又例如大陸國家編號是 7,最大的四個出版社(國家官方的),出版社編號分別為 01, 02, 03, 04。於是,得出的 ISBN 就是 978-7-01-XXXXXX-Y 了,書本編碼總共可編 6 位,即一百萬本書。

大陸出版社,三個位的,排第一係商務 (100),第二係中華 (101),重要型不言而喻。北京商務所有書的 ISBN 都係 978-7-100-XXXXX-Y。理論上可編十萬本書,但其實至今只係編咗幾千本。

《ISBN 10 和 ISBN 13 的分別》
(i) 長度不同 (ii) 計算核對碼方法不同,見下圖。ISBN 13 核對碼採用商品條碼 EAN 核對碼的計算方法

《ISBN 13 和 EAN 的分別》
EAN 是沒有 hyphen 的,例如 9789620702877。ISBN 13 是有 hyphen 的,例如 978-962-07-0287-7

《怎樣知道 hyphen 怎樣放?》
ISBN 的 hyphen,個格式係 978-AAA-XXX-YYY-Z ,hyphen 放邊個位要睇返該國家編碼、出版社編碼有幾長。舉一個例子,978-988-1XXXX-Y-Z,其實呢個範圍的 ISBN,出版社編碼都係有 5 個位,書本碼只得 1 位。寫成 978-988-1X-YYYY-Z 是錯的。

又例如澳門特區政府出版物,出版社編碼是「1」,ISBN 就會寫成 978-99937-1-YYY-Z。

香港的出版社,出最多書的,當然被編較短的出版社編碼。

像某教科書霸主,就霸了 962-00、962-01、988-00 三大個號碼(另外重有 962-359、962-999、988-224)。搞到香港政府自己,都係排 962-02 咋。

出版社之所以有多過一個號碼,原因係本來個號碼用完。

香港的 ISBN 劃分:

格式:978-962-XX-YYYY-Z
出版社編號:00至19

格式:978-962-XXX-YYY-Z
出版社編號:200至699,900至999

格式:978-962-XXXX-YY-Z
出版社編號:7000至8499,8700至8799

格式:978-962-XXXXX-Y-Z
出版社編號:85000至86999

格式:978-988-XX-YYYY-Z
出版社編號:00至11

格式:978-988-XXX-YYY-Z
出版社編號:200至799

格式:978-988-XXXX-YY-Z
出版社編號:8000至9699

格式:978-988-XXXXX-Y-Z
出版社編號:12000至19999,97000至99999
(實際分派的先後次序:97000至99999,17000至19999,15000至16999,現在派緊12XXX)

澳門特別行政區 ISBN 劃分:

格式:978-99937-X-YYY-Z
出版社編號:0至1

格式:978-99937-XX-YY-Z
出版社編號:20至59

格式:978-99937-XXX-Y-Z
出版社編號:600至999

格式:978-99965-X-YYY-Z
出版社編號:0至3

格式:978-99965-XX-YY-Z
出版社編號:40至79

格式:978-99965-XXX-Y-Z
出版社編號:800至999

中國大陸 ISBN 劃分:

國家級出版社
格式:978-7-0X-YYYYYY-Z
出版社編號:01,02,03,04

其他重要的出版社
格式:978-7-1XX-YYYYY-Z
出版社編號:100到122

各地人民出版社
格式:978-7-2XX-YYYYY-Z
出版社編號:200到229

省級大學的出版社
格式:978-7-3XX-YYYYY-Z
出版社編號:300到314

各省市級出版社
格式:978-7-5XXX-YYYY-Z
出版社編號:5XXX

其他較小型出版社
格式:978-7-8XXXX-YYY-Z
出版社編號:8XXXX
格式:978-7-9XXXXX-YY-Z
出版社編號:9XXXXX

台灣的 ISBN 劃分:

格式:978-957-XX-YYYY-Z
出版社編號:00至02、05至19、21至27、31至43

格式:978-957-XXX-YYY-Z
出版社編號:440至819

格式:978-957-XXXX-YY-Z
出版社編號:0300至0499、2000至2099、8200至9699

格式:978-957-XXXXX-Y-Z
出版社編號:28000至30999、97000至99999

格式:978-986-XX-YYYY-Z
出版社編號:00至11

格式:978-986-XXX-YYY-Z
出版社編號:120至559

格式:978-986-XXXX-YY-Z
出版社編號:5600至7999

格式:978-986-XXXXX-Y-Z
出版社編號:80000至99999

979-0 叫 International Standard Music Number (ISMN),對象是樂譜。樂譜號碼的寫法是(舊式)M-xxxx-yyyy-z(2008年起)ISMN 979-0-xxxx-yyyy-z

除 ISMN 外,有一個很類似 ISBN 的,叫 ISSN, International Standard Serial Number,雜誌用的編碼。

ISSN 雜誌的格式為 ISSN xxxx-xxxz,x 是該雜誌,z 是核對碼
EAN bar code 的格式為 977xxxxxxxyyz,尾三和尾二兩碼為版次,如果無改通常為「00」

在香港、在中國大陸,所有公開出版物,均需註冊。

根據香港《書刊註冊條例》(香港法例第142章) 的規定:任何人違反《書刊註冊條例》,即屬犯罪,一經定罪,可處罰款$2,000。

《書刊註冊條例》規定在新書刊製成後一個月內,把書刊五本連同已填妥的「書刊註冊表格」一式兩份,郵寄或親身送交書刊註冊組。而書刊註冊不收費用。

http://www.hkpl.gov.hk/tc_chi/books_reg/books_reg_intro/books_reg_intro.html

但,書刊註冊只是指,每三個月把新出版物,刊登在政府憲報上發表。在香港出書係無規定要申請 ISBN。

相反在中國大陸,出版書刊,大家都知道受嚴格限制,而在大陸出書,要得到 ISBN 方可出版。所以大陸出現了借用其他出版社書號的現象,亦出現了賣 ISBN 的生意。

在美國,申請 ISBN 每個 125 美元。批次購買 10 個 250 美元,100 個 575 美元,1000 個 1000 美元。

在香港,申請 ISBN,免費。

重等? http://www.hkpl.gov.hk/tc_chi/books_reg/books_reg_isbn/books_reg_isbn.html

其實如果係一個 iPhone 或 Android app,而它主要是提供資料內容的,呢個 app 係有資格申請 ISBN 的。

各流動電話供應商的電話字頭

可能你會話,好多人都曾經轉過台啦,睇人地個電話號碼都唔會知道佢用邊間公司,但係呢個表嘅真正用途係,當你想開一張新卡,自製一個新嘅幸運號碼嘅時候,要知道響邊度先搵得到。例如,我想搵一個668字頭的,睇咗下表之後,你就唔會盲衝衝走去XX通度搵啦。順帶一提,有部份號碼係畀電訊管理局留起...