合字
历史
印刷合字单纯源于手写本中连写的字符。以发现的最早的楔形文字手写本中就已经含有很多连写字符。中世纪的拉丁文手写本中,誊写僧人为加快速度将字符连写,诞生了很多手写缩合字,如在哥特体中,带右圈的字母( b , o ,和 p )和带左圈的字母( c , e , o , d , g 和 q )的圈部都被重叠书写。很多手写本字符如 h , m 和 n 的竖划都被重叠,而且诞生了很多手写缩合字。14世纪的手写本中含有很多这种手写缩合字。
当活字印刷诞生后,很多合字直接被制造成了铅字。但是在1950年代无衬线字体广泛使用,以及1970年代照相排版技术之后,合字就逐渐很少被使用。最早能进行合字电脑排版(之后激光打印机)之一的是高德纳的T e X程序(详见下文)。这一潮流也影响到了1985年之后的桌面排版技术。早期电脑软件无法进行合字替换(但T e X可以),大部分新制作的电脑字体里也没有合字。早期的个人电脑多使用英文,而英文中并不是必须使用合字,所以也没有实际需要。
随着现代电脑处理的多语言化和现代电子排版技术(如OpenType)的流行,合字开始逐渐恢复被使用。
拉丁文字
拉丁文本中的典型合字
书法合字
fi和fl
许多合字都把字母 f 和其后的字符组合起来,最常用的就是 fi (或 fi ,显示为两个独立字符)。很多字体的这两个字母并排在一起后,字母 i 上的点会抵挡到字母 f 的弧形勾,无法正确排印,所以干脆就制造一个合字铅字,把i的点融入f的勾来直接使用。其他f合字包括 fj 、 fl (fl)、 ff (ff)、 ffi (ffi)、和 ffl (ffl)。其他合字包括 fa 、 fe 、 fo 、 fr 、 fs 、 ft 、 fb 、 fh 、 fu 、 fy ,以及 f 后加句号、逗号或连字符,还有不太常用的双写 ff 和 fft 。
使用这些合字是因为通常的小写字母 f 中弧形勾影响字符间距调整。
有时,跨词合字(如 shelfful 的 ff )是不希望出现的,电脑程序(如T e X)提供手动方式将它们分开。一些字体带有 fff 合字(如Requiem体甚至包括一个 fffl 合字)用于德语的复合词,如 Sauerstoffflasche (氧气罐)和 Schifffahrt (游艇)(仅在遵循1996年拼写改革法的前提下才写作 fff )。正式的德文正写法,如杜登词典所述,不赞成跨词合字,由于 fff 组合在德文中只会在组合词出现如( Schiff-fahrt 、 Sauerstoff-flasche ),所以这样跨词合字在德文中使用会被认为是不正确的。 英语中类似的例子则是 Shelfful 。
土耳其语中有带点和不带点的字母I,如单词 fırın (烤箱)和 fikir (主意)。 fi 合字容易混淆,所以在土耳其文排印中一般不使用该合字。像 fl 合字一般也不用,土耳其语本来就没有这样的拼写。
“ß”写作“ſʒ”合字的例子。柏林街头的标识( Petersburger Straße )。右边的标识( Bersarinplatz )最后一个字是tʒ合字。
合字 ſʒ (sz)和 tʒ (tz)来自德语哥特体,现在街头、城市广场的标识中带 Platz 或者以 -platz 结尾时仍常被使用。
有时 st (st)、 ſt (ſt)、 ch 、 ct 、 Qu 以及 Th 的合字也被使用(如字体Linux Libertine)。
德文ß
德语中 eszett 合字(亦称 scharfes S “清S”)ß,其名称es-zett(意为“S-Z”)表示其源自“长S加Z”或“长S在圆S之上”。尽管“长s”ſ已经在现代德文正写法消失了,ß仍被保留并被视为合字,传统上在大写的时候以及字母排序的时候改写为“SS”。2008年其大写字母“ẞ”加入Unicode并出现更多字形。ß仅在德国和奥地利使用,瑞士德文不用这个合字。
起源于合字的字母
Adobe Caslon Pro中的合字
字母 W 是7世纪左右才被加入拉丁字母表的,其发音不尽相同。古英语使用卢恩字母Ƿ (Wynn),但受到诺曼人影响后废弃不用。14世纪,这个起源于双写的 V 或 U 的“新”字母 W 诞生并在字母表中占有一席。由于它相对于其他字母比较年轻,只有很少欧洲语言(英语、荷兰语、德语、波兰语、威尔士语、马耳他语和瓦龙语)使用它来拼写本土词汇。
字符 Æ (小写 æ ,中世纪时称为 aesc )作为一个字符在丹麦语、挪威语、冰岛语以及古英语中使用,并不是一个印刷用的合字。它是一个实在的字母——代表一个元音,且在字母表中有位置。现代英文正写法中 Æ 不作为一个单独字母,而只是一种拼写异形,如百科全书的英文单词encyclopædia也可拼写成encyclopaedia或encyclopedia。
Æ 源自中世纪拉丁文,当时只是一些词汇的随意合字如Æneas。它还可以在英文和法文现,但是现在已经倾向把 A 和 E 分开印刷。 同样, Œ 和 œ 在法文中虽然通常印刷成合字,但在技术限制情况下仍可以拆开书写。
在德文正写法中,带两点的字母元音ä、ö和ü来自历史上的 ae 、 oe 、 ue 合字(严格的说是标在顶端的e,即 aͤ , oͤ , uͤ )。现在当文字处理无法显示这三个字符的情况下仍可改写为二合字母 ae、oe、ue 。字母排序中它们不等价于 ae 、 oe 、 ue ,而是被简单看成 a 、 o 、 u 。而北欧语言则不同:带两点的字母被视为独立字母,并排在字母表最后。
一些元音中的圈形附加符号,如 å 起源于一个 o 合字 。现在把旧式aa改写为 å 已经称为不成文习惯,但在此之前也可写成a上再加一个小a( aͣ ),如Johannes Bureus、Runa ABC boken 。
uo 合字ů的使用实例也在早期现代高地德语里找到,但其后来混同到 u 中(如中期高地德语的 fuosz 、早期现代高地德语 fuͦß 、现代德语 Fuß )。它仍存在于捷克语中,被称为 kroužek 。
西班牙语和葡萄牙语中的上波浪线,分别用于字母 ñ 表示元音鼻音化,起源于一个 nn 合字 (Espanna = España、anno = año)。同样法语中的抑扬符也源自不发音s。 法语、葡萄牙语、西班牙语等中的字母 ç 其实是一个字母c盖在一个z上面的形式。
字母ƕ(Hwair)仅用于转写哥德语,代表 hw 合字。最早在1900年左右心理学者使用这个字用于代替二合字母 hv 用于表示有问题的现象,如Jacques Paul Migne在其1860年代的著作(Patrologia Latina,第18卷)。
拜占庭帝国有一个独特的合字 Ȣ (o-u合字),它源于希腊字母的 ο-υ 两个字母的合字,并被加入到了字母表中。
ƣ(Gha)是一个罕见的字母,起源于Q和G,但在ISO的文件中误注成O-I合字(参见Unicode注解)。
国际音标使用合字来表示塞擦音,其中6个有Unicode编码: ʣ、ʤ、ʥ、ʦ、ʧ、ʨ 。一个擦音仍使用合字: ɮ ,而国际音标扩展里加入了另外三个: ʩ、ʪ、ʫ 。
还有一些罕见合字,如 Ꜳꜳ、Ꜵꜵ、Ꜷꜷ、Ꜹꜹ、Ꜻꜻ、Ꜽꜽ、Ꝏꝏ、ᵫ、ᵺ、Ỻỻ、Ꜩꜩ、ᴂ、ᴔ 。
起源于合字的符号
Et合字(Insular Minuscule的写法)
最常用的合字符号当属 & 。它起源于 E 和 t 的合字,即拉丁文的单词“和”(et)。它在法文中保持原音原意而在英文中也使用。由于其使用广泛,一般已经不认为它是一个合字而是一个普通符号。
和其他合字一样,它被仍当作一个字母来使用(如早期现代英语),英语中它念作and而不是et,而 &c 念作et cetera(等等)。大多数字体中的字形和两字直接组合不一样,但仍有一些字体(如Trebuchet MS)就把 & 设计为合字。
同样,美元符号 $ 可能也起源于合字(“pesos”,但有也有其他不同说法),但现在实际上已经被当成一个普通符号。 西班牙比塞塔(peseta)也有时被写作合字₧(源自Pts)。
二合字母
大写IJ字形看起来像“断臂的 U ”合字(Helvetica字体,由Omega T e X渲染)
二合字母,如西班牙语和威尔士语中的 ll ,一般不被看成是合字,因为印刷上两个字母通常是分开的。正如上讨论的合字一样,一些二合字母在一些语言中有不同处理方式。西班牙1994年拼写改革时,二合字母 ch 和 ll 已经被考虑为分开的两个字母。
法文的情况也一样, œu 被看成为合字 œ 与字母 u 的组合。
尽管如此,荷兰语中“ij”的定位比较模糊。根据不同的使用标准,它可看成是一个二合字母,或合字,或者一个独立字母。它有独立的大小写形式,而在一些专业字体中,通常是有一个独立字形也有合字(如Zapfino)。无衬线字体大写字母的 IJ 流行于荷兰,通常形状像是一个断左臂的 U 。更令人混淆的是,手写时可以把小写字母 y 写作没有点的 ij ,和大写字母 IJ (同样没有点)看起来只是大小差异而已。而 Y 在本土荷兰语词汇中不被使用。
含有合字的拉丁语文
丹麦语和挪威语
法语
德语
冰岛语
瑞典语
非拉丁字符
合字不仅出现在拉丁文本中:
婆罗米系文字的元音附标文字频繁使用合字标注辅音。合字的数量依据语言而不同,如同样的天城文,用于梵文的合字就要比印地文多。总数为37的辅音中,在天城文两个字母组成的合字总数为1369,很少字体能全部显示这些合字。微软Windows系统附带的Mangal等字体带有印地语支持,但不能正确处理在द, ट, ठ, ड,和ढ右边的辅音合字,而只是加virama后按照一般形式显示在辅音之后。
希腊字母中使用一些合字,特别是在 Ο (Omicron)和 Υ (Upsilon)连写并衍生出一个西里尔字母。参见Ȣ字母。
西里尔合字: Љ 、 Њ 、 Ы 、 Ѿ 。Iotified西里尔字母是早期西里尔字母І和其他元音的合字: Ꙗ ( Я 的前身)、 Ѥ 、 Ѩ 、 Ѭ 、 Ю (源自另外一个合字 Ѹ , У 的早期形式)。塞尔维亚语字母表中的两个字母Љ和Њ在19世纪曾分别是Л、Н与软音符号( ь )的合字。还有一个 Я 和 Е 的合字: Ԙԙ ,其他合字包括 Ꚅ、ꚅ 和 Ꚉ、ꚉ 。
格拉哥里字母的一些手写形式:用于中世纪到19世纪书写的斯拉夫人语言,多为方形且常用合字。
在希伯来语中字母 א (Aleph)和 ל (Lamed)在一些前现代文本中(主要是宗教或“犹太-阿拉伯”文本)可组合为合字。该组合很常用,因为 [ʔ][a]l- (在希伯来文中写作aleph加lamed)是阿拉伯语中的定冠词。
阿拉伯文:各个字母在词头,词中,词尾均有不同形式。如阿拉伯文的mīm,单独书写为 م ,三个连写( mmm ,显示为词头,词中,词尾形)就变为 ممم 。注意lām + ʼalif的情况是特殊的: ﻻ ,lām + ʼalif在词中、词尾形式是 ﻼ 。在Unicode有几个特殊的合字,如 安拉 位于U+FDF2: ﷲ ;太斯米位于U+FDFD: ﷽ 等。
乌尔都语使用阿拉伯文字纳斯塔里格体的手写体,在电子排印中有大量合字。乌尔都语最常用的排版工具InPage使用纳斯塔里格体字体产生多达20,000个合字。
藏文在Unicode有一个特殊的合字U+0F00: ༀ (唵)。
日文自江户时代起便有以把文字组合在一起形成文字绘的游戏,例子有へのへのもへじ。
汉字中如孔孟好学、招财进宝、日进斗金、双喜传统上经常会合为一字书写,称为合文,另外还有大量叠字流传至今。
天城文的 ddhrya 合字 (द् + ध् + र् + य = द्ध्र्य) 。字体:JanaSanskritSans
日文的文字绘
中文招财进宝的合书
中文孔孟好学的合书
电脑排版
T e X是电脑排版系统中能使用合字的典型程序。它能提供五个常用合字: ff 、 fi 、 fl 、 ffi 和 ffl 。当T e X遇到这些组合时会自动替换成合字。当然操作者可以手动切换。
OpenType字体格式可以针对一个字符提供多个字形,因此用来作为合字替换,但需要软件支持。X e T e X就是一个可以运用这一优势的T e X排版引擎。这种替换原要用于阿拉伯文排版,但现在已经广泛用于西文OpenType字体。OpenType中,这些是标准 liga 、历史性 hlig 、上下文 clig 和任意性 dlig 合字。这些可用 font-feature-settings 加入到CSS3。
CSS还支持 font-variant-ligatures 特效。 common-ligatures 、 discretionary-ligatures 、 historical-ligatures 和 contextual 特效也被支持。
下表列出了常用文字对的合字以及Unicode代码。正确显示需要使用能正确处理合字的操作系统和浏览器并调用正确的Unicode电脑字体。
Unicode中对合字的处理不是一个字符定义,而是一种绘制形式。即Unicode不把合字当作一个字符,而是把合字处理为字符序列,由字形绘制系统去处理是否用合字的字形在屏幕上显示或者打印。比如,如果一个现代字体需要显示h后加r,且该字体确实有hr合字,这个合字才会被显示出来。因此,使用特殊Unicode合字字符是“不鼓励”且“在任何环境下不会被再度编码”的。 注意,合字æ和œ不能随意替代ae和oe,比如does不能写作dœs。
Unicode中的合字列表(拉丁字母)
另外,Dz、克罗地亚语和波斯尼亚语字母DŽ、LJ和NJ都有单独的码位。它们不是合字而是二合字母。
U+0238和U+0239是二合字母,但实际上是合字。
相关条目
二合字母
合文
动态组字
叠字
免责声明:以上内容版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。感谢每一位辛勤著写的作者,感谢每一位的分享。
相关资料
- 有价值
- 一般般
- 没价值