Affinity Publisher 1.8.4ベータでの日本語禁則処理を検証(本題)

以下にそれぞれの文字が禁則処理の対象になっているかを調べた結果を書きます。全ての文字を調べることはできませんので、Unicodeの第一面だけ、さらに日本語で多く使用する文字(ラテン文字、日本語用の記号)を対象にしています。それ以外の言語や数学記号、装飾記号、さらに私の知らない記号類は省いています。対象範囲内でJIS X 4051にこだわらず、可能性があるものをピックアップしました。

調査方法は、対象の文字の前後を漢字で囲み、1行の長さを変更して行頭もしくは行末に配置されるかを確認しています。文字によっては特定の種類の文字(数字とか)に対してのみ分割禁止がされている可能性がありますが、そこまで調べることはできません。あくまでも前後の漢字に対する挙動ということでご理解ください。

表示Unicode順です。使い勝手としては文字用途別(始まりの括弧類、句点類など)の方がいいのかもしれませんが、そうすると言語を横断する形になってしまいます。必要な人は自分で組み替えてください。

表示にFONTPLUSの「UD明朝 Pr6N L」を使用しています。ただ、FONTPLUSでは時々メンテナンスを行うため、Webフォントで表示されない時間帯(こちらで確認できます)があります。その場合、お使いの環境によっては文字化けするかもしれません。あらかじめご了承ください。

参考としWordとWebも書いておきます。WebはChromium 81.0.4044.142(Vivaldi 3.0.1874.23)を使用しています。

表の見方

code:Unicodeでの文字コード

文字:「UD明朝 Pr6N M」での表示結果

禁則:行頭禁則(前の文字と分割禁止)か行末禁則(次の文字と分割禁止)かを「頭」「末」で記載

Publisher:Affinity Publisher 1.8.4ベータで禁則になっているものは●を記載

Word:Microsoft Wordの禁則文字で「高レベル」に含まれるものは●を記載

Web:上記環境のブラウザで禁則になっているものは●を記載

備考:文字の説明など

基本ラテン文字・ラテン1補助

code 文字 禁則 Publisher Word Web 備考
0021 !  
0024 $   ドルの通貨記号。次の数字と分割禁止
0025 %   パーセント記号。前の数字と分割禁止
0028 (  
0029 )  
002C ,  
002E .  
003A :  
003B ;  
003C <        
003E >        
003F ?  
005B [  
005C \   フォントによっては円記号で表示される
005D ]  
007B {  
007D }  
00A2 ¢   セントの通貨記号。前の数字と分割禁止
00A3 £   ポンドの通貨記号。次の数字と分割禁止
00A5 ¥   円の通貨記号。次の数字と分割禁止
00A7 §     セクション記号。次の数字と分割禁止
00AB «      
   
00BB »      
   
00B0 °   度記号。前の数字と分割禁止
02B9 ʹ       分記号。前の数字と分割禁止
02BA ʺ       秒記号。前の数字と分割禁止

一般句読点

code 文字 禁則 Publisher Word Web 備考
2018      
 
2019    
   
201C      
 
201D    
   
2030   パーミル記号。前の数字と分割禁止
2031     万分率記号。前の数字と分割禁止
2032   プライム記号。日本ではダッシュともいう
2033   ダブルプライム記号
2034     トリプルプライム記号
2039      
   
203A      
   
203B       米印。ビュレットと同様、リストのマーカーに使われる
203C      
2047      
2048      
2049      
2057       4つのプライム記号
205A      

通貨記号

主なものに絞っています。

code 文字 禁則 Publisher Word Web 備考
20A9     ウォンの通貨記号。次の数字と分割禁止
20AC     ユーロの通貨記号。次の数字と分割禁止
20BF     ビットコインの通貨記号。次の数字と分割禁止

文字様記号

code 文字 禁則 Publisher Word Web 備考
2103   摂氏を表す合字。前の数字と分割禁止
2109     華氏を表す合字。前の数字と分割禁止
2113       リットル記号として使われる場合は前の数字と分割禁止
2116     ナンバーを表す合字。次の数字と分割禁止
2121       電話番号を表す合字。次の数字と分割禁止
2122       商標を表す合字。前の文字と分割禁止
212B       オングストローム記号として使われる場合は前の数字と分割禁止
213B       ファクシミリ番号を表す合字。次の数字と分割禁止
260E       電話番号を表す絵文字。次の数字と分割禁止
260F       電話番号を表す絵文字。次の数字と分割禁止

CJK用の記号および分音記号

code 文字 禁則 Publisher Word Web 備考
3001  
3002  
3005   漢字の繰り返し文字
3008  
3009  
300A  
300B  
300C  
300D  
300E  
300F  
3010  
3011  
3012       郵便番号を表す記号。次の数字と分割禁止
3014  
3015  
3016    
3017    
3018    
3019    
301A    
301B    
301D    
301E    
301F    
3020       郵便番号を表す絵文字。次の数字と分割禁止
3031       大返し(繰り返し記号)。前の文字と分割禁止
3032       大返し(繰り返し記号)。前の文字と分割禁止
3033       以前の記事を参照
     
3034       以前の記事を参照
     
3035     以前の記事を参照
3036       郵便番号を表す記号。次の数字と分割禁止
303B     繰り返し文字。縦組でしか使わない
303D       うたひっかけ。歌や台詞の開始の記号。起しの鍵括弧と同源だと思っている

ひらがな・カタカナ

code 文字 禁則 Publisher Word Web 備考
3041      
3043      
3045      
3047      
3049      
3063      
3083      
3085      
3087      
308E      
3095        
3096        
309B   濁点記号
309C   半濁点記号
309D   ひらがなの繰り返し文字
309E   ひらがなの繰り返し文字
30A1      
30A3      
30A5      
30A7      
30A9      
30C3      
30E3      
30E5      
30E7      
30EE      
30F5      
30F6      
30FB   中黒
30FC     長音
30FD   カタカナの繰り返し文字
30FE   カタカナの繰り返し文字

漢文用記号

code 文字 禁則 Publisher Word Web 備考
3190       漢文の縦棒は前の文字と分割禁止
3191       返り点は全て前の文字と分割禁止。フォントによりそのまま使用するものと、下付き文字などの縮小が必要なものがある。下付き文字にした場合は下付き文字の組版規則により前の文字と分割禁止になる
3192      
3193      
3194      
3195      
3196      
3197      
3198      
3199      
319A      
319B      
319C      
319D      
319E      
319F      

カタカナ拡張

アイヌ語を表記するためのもの。こちらを参照のこと。 禁則になるのかは知らないが、小字を使用しているため、一応記載。

code 文字 禁則 Publisher Word Web 備考
31F0          
31F1          
31F2          
31F3          
31F4          
31F5          
31F6          
31F7          
31F8          
31F9          
31FA          
31FB          
31FC          
31FD          
31FE          
31FF          

CJK互換文字

%や℃が行頭禁則であるならばこれらも行頭禁則に含める可能性がある。数が多いのでいくつかをピックアップ。

code 文字 禁則 Publisher Word Web 備考
330D       Wordでは「組文字」という。縦組と横組があるが、Unicodeでは横組しか定義されていないはず。Adobe-Japan1では両方ある
3310      
3315      
3316      
3351      
3386       単位記号を正方形内に収めたもの
3387      
338F      
3396      
339E      

CJK統合漢字

%や℃が行頭禁則であるならばこれらも行頭禁則に含める可能性がある。数が多いのでいくつかをピックアップ。

code 文字 禁則 Publisher Word Web 備考
5186       日本の通貨。前の数字と分割禁止
518A       紙を綴じたものを数える単位。前の数字と分割禁止
5E74       日付の単位。前の数字と分割禁止
65E5       日付の単位。前の数字と分割禁止
6708       日付の単位。前の数字と分割禁止
672C       細長いものを数える単位。前の数字と分割禁止
679A       平たいものを数える単位。前の数字と分割禁止
74E9       キログラム
74F1       ミリグラム
7ACF       キロリットル
7AD3       ミリリットル
7C81       キロメートル
7CCE       センチメートル

縦書き形

code 文字 禁則 Publisher Word Web 備考
FE10   縦書用のカンマ
FE11    
FE12    
FE13    
FE14    
FE15    
FE16    
FE17    
FE18    
FE35    
FE36    
FE37    
FE38    
FE39    
FE3A    
FE3B    
FE3C    
FE3D    
FE3E    
FE3F ︿    
FE40    
FE41    
FE42    
FE43    
FE44    
FE47    
FE48    

半角形/全角形

code 文字 禁則 Publisher Word Web 備考
FF01  
FF04    
FF05    
FF08  
FF09  
FF0C  
FF0E  
FF1A    
FF1B    
FF1C        
FF1E        
FF1F  
FF3B  
FF3D  
FF5B  
FF5D  
FF5F    
FF60    
FF61  
FF62  
FF63  
FF64  
FF65    
FF67      
FF68      
FF69      
FF6A      
FF6B      
FF6C      
FF6D      
FF6E      
FF6F      
FF70      
FF9E    
FF9F    
FFE0    
FFE1    
FFE5    
FFE6