Word から PDF として保存した文書のテキストをコピーするとハイフンが改行として飛ぶ

Word から特定条件で PDF保存 した文書のテキストをコピーしようとすると、奇妙な現象が発生したので、その再現方法と回避法をメモしておきます。

現象発生・再現

ハイフンを含むWord文書
ハイフンを含むWord文書

まず適当に Microsoft Word でハイフン(-)を含む文書を作成します。

名前を付けて保存
名前を付けて保存

次に、この文書をリボンの「ファイル」から「名前を付けて保存」。

PDFとして保存
PDFとして保存

ファイル種類のプルダウンからPDFを選択して保存。

保存されたPDF
保存されたPDF

保存されたPDFを開くと一見普通ですが、全選択してテキストをメモ帳などにコピペすると……

Hoge
fuga
Piyopi
yo

……ハイフンの部分が改行扱いになってしまいました。正しいテキストがコピーされていません。

これが今回頭を悩ませた原因。

回避策

検索したところ、今回のハイフンの話そのままではないですが、「テキストをコピペしたときに内容がおかしい」という話であれば「アクセシビリティ用の構造タグ」が悪さをしている、という記事がヒットしました。

そこで検証。

PDFとして保存
PDFとして保存

先程の「名前を付けて保存」のところで、そのまま保存はせずに「その他のオプション」を開きます。

オプションをクリック
オプションをクリック

保存先を選択するダイアログが別で開くので、下部の「オプション」をクリック。

オプションの中で「アクセシビリティ用の構造タグ」のチェックを外す
オプションの中で「アクセシビリティ用の構造タグ」のチェックを外す

オプションの中で「アクセシビリティ用の構造タグ」のチェックを外します。これで「OK」として「保存」。

先程と同様にPDFを開いて全選択してコピペすると……

Hoge-fuga
Piyopi-yo

……きちんとテキストがコピーできました。やはり「アクセシビリティ用の構造タグ」が悪さをしていたようです。

(オマケ) 検証

Adobe PDF として保存
Adobe PDF として保存

ちなみに、「名前を付けて保存」ではなく、「Adobe PDF として保存」を選択した場合はどうなるでしょうか?

Adobe PDF として保存 のダイアログ
Adobe PDF として保存 のダイアログ

ダイアログからまずはそのまま保存。

Hoge-fuga
Piyopi-yo

……こちらはオプションを弄らずとも、正常にコピペできました。

Adobe PDF として保存 のダイアログ
Adobe PDF として保存 のダイアログ

念のため、今度はオプションを開きます。

「タグ付き Adobe PDF でアクセシビリティと折り返しを有効にする」のチェックを外す
「タグ付き Adobe PDF でアクセシビリティと折り返しを有効にする」のチェックを外す

先程と似たような「アクセシビリティ」「タグ」の単語が含まれているオプション「タグ付き Adobe PDF でアクセシビリティと折り返しを有効にする」のチェックを外します。

Hoge-fuga
Piyopi-yo

これでも正常にコピペできました。


以上より、「名前を付けて保存」でファイル種類から「PDF」を選択して保存した場合のみ、テキストが正しくコピペできない現象が発生するということが分かりました。

……何故似たような項目でも挙動が異なるのかが分かりませんが……。

参考

この記事を書いた人

アルム=バンド

フロントエンド・バックエンド・サーバエンジニア。LAMPやNodeからWP、Gulpを使ってejs,Scss,JSのコーディングまで一通り。たまにRasPiで遊んだり、趣味で開発したり。