Word から特定条件で PDF保存 した文書のテキストをコピーしようとすると、奇妙な現象が発生したので、その再現方法と回避法をメモしておきます。
現象発生・再現

まず適当に Microsoft Word でハイフン(-
)を含む文書を作成します。

次に、この文書をリボンの「ファイル」から「名前を付けて保存」。

ファイル種類のプルダウンからPDFを選択して保存。

保存されたPDFを開くと一見普通ですが、全選択してテキストをメモ帳などにコピペすると……
Hoge
fuga
Piyopi
yo
……ハイフンの部分が改行扱いになってしまいました。正しいテキストがコピーされていません。
これが今回頭を悩ませた原因。
回避策
検索したところ、今回のハイフンの話そのままではないですが、「テキストをコピペしたときに内容がおかしい」という話であれば「アクセシビリティ用の構造タグ」が悪さをしている、という記事がヒットしました。
そこで検証。

先程の「名前を付けて保存」のところで、そのまま保存はせずに「その他のオプション」を開きます。

保存先を選択するダイアログが別で開くので、下部の「オプション」をクリック。

オプションの中で「アクセシビリティ用の構造タグ」のチェックを外します。これで「OK」として「保存」。
先程と同様にPDFを開いて全選択してコピペすると……
Hoge-fuga
Piyopi-yo
……きちんとテキストがコピーできました。やはり「アクセシビリティ用の構造タグ」が悪さをしていたようです。
(オマケ) 検証

ちなみに、「名前を付けて保存」ではなく、「Adobe PDF として保存」を選択した場合はどうなるでしょうか?

ダイアログからまずはそのまま保存。
Hoge-fuga
Piyopi-yo
……こちらはオプションを弄らずとも、正常にコピペできました。

念のため、今度はオプションを開きます。

先程と似たような「アクセシビリティ」「タグ」の単語が含まれているオプション「タグ付き Adobe PDF でアクセシビリティと折り返しを有効にする」のチェックを外します。
Hoge-fuga
Piyopi-yo
これでも正常にコピペできました。
以上より、「名前を付けて保存」でファイル種類から「PDF」を選択して保存した場合のみ、テキストが正しくコピペできない現象が発生するということが分かりました。
……何故似たような項目でも挙動が異なるのかが分かりませんが……。