mojisucount
文字数カウント mojisucount.com
用語解説 約7分で読める

日本語と英語の文字数カウントは何が違う?単語数と空白の考え方

日本語と英語の文字数カウントの違いを比較するイメージ画像

日本語の文章では「400字以内」「1000文字程度」のように、文字数で文章量を指定することが多くあります。一方、英語では「300 words」「1000 characters」のように、単語数と文字数を分けて考える場面がよくあります。同じ「文章の長さ」を測っているように見えても、日本語と英語では基準にする単位が違うため、単純に比較すると誤解が起きやすくなります。

この記事では、日本語と英語の文字数カウントの違いを、文字数・単語数・スペース・句読点・全角半角・バイト数の観点から整理します。レポート、翻訳、SNS投稿、Webフォームの文字数制限を確認するときの実用的な見方も紹介します。

1. 日本語は「文字数」、英語は「単語数」が基準になりやすい

日本語の文章量は、基本的に「文字数」で表します。ひらがな、カタカナ、漢字、数字、記号など、画面上に見える文字を1つずつ数える考え方です。原稿用紙や小論文、エントリーシート、SNSの投稿文なども、ほとんどの場合は文字数が基準になります。

英語では、文章量を測るときに「word count(単語数)」がよく使われます。英語は単語と単語の間にスペースがあるため、単語の数を比較的簡単に数えられます。エッセイ、論文、試験のライティング、翻訳の見積もりでは、文字数よりも単語数が重視されることがあります。

項目 日本語 英語
よく使う基準 文字数 単語数、または文字数
区切り方 単語の間にスペースを入れない 単語の間にスペースを入れる
代表的な指定 400字以内、2000文字程度 300 words、1000 characters
注意点 全角・半角、改行、空白の扱い スペース込み/なし、単語の分割ルール

2. 同じ意味でも、日本語と英語では文字数が大きく変わる

日本語は、漢字1文字に多くの意味を含められる言語です。たとえば「文字数」は3文字ですが、英語では「character count」と2単語・複数文字で表します。「国際連合」は4文字ですが、英語では「United Nations」となり、単語数では2語、文字数ではスペースを含めて14文字になります。

そのため、日本語400字と英語400 charactersを同じ文章量として扱うことはできません。日本語の文字数、英語の単語数、英語の文字数は、それぞれ別の指標として見る必要があります。

日本語で見る量 英語で見る量
文字数 / character count 「文字数」= 3文字 「character count」= 2単語、15文字前後
国際連合 / United Nations 4文字 2単語、スペース込み14文字
今日は雨です / It is raining today. 6文字 4単語、スペースやピリオドも含めて計測

3. スペースと改行の扱いが違いを生みやすい

日本語では、文章の途中にスペースを入れないことが多いため、「空白込み」と「空白なし」の差は比較的小さくなりがちです。ただし、段落の字下げ、箇条書き、表の中の全角スペースなどがある場合は、空白を含めるかどうかで文字数が変わります。

英語では、単語と単語の間のスペースが文章の構造そのものです。character countを確認するときは、スペース込みか、スペースなしなのかを必ず確認しましょう。WebフォームやSNSの文字数制限では、スペースも1文字として数えるケースがあります。一方、翻訳や英語エッセイでは、スペースではなく単語数が基準になることが多いです。

  • 日本語:空白は少ないが、全角スペースや改行の扱いに注意する。
  • 英語:スペースが単語の区切りになるため、文字数と単語数を分けて見る。
  • 混在文:日本語と英語が混ざる文章では、単語数だけを見ると実際の文章量をつかみにくい。

4. 句読点・記号・全角半角はどう数える?

文字数カウントでは、句読点や記号も多くの場合1文字として扱われます。日本語の「、」「。」、英語の「,」「.」、かっこ、引用符、ハッシュタグ、数字なども、画面上に入力されていればカウント対象になります。

ただし、見た目が似ていても、全角文字と半角文字は別の文字です。「A」と「A」、「1」と「1」、「 」と半角スペースは、表示幅も文字コードも異なります。Webフォーム、データベース、バイト数制限がある入力欄では、単純な文字数だけでなく、全角半角やバイト数も確認しておくと安全です。

見るポイント 確認したいこと よくある場面
句読点・記号 「、」「。」「,」「.」「#」などを含めるか SNS、フォーム、レポート
全角・半角 見た目が近い文字を区別するか 入力制限、会員登録、コード入力
バイト数 UTF-8やShift_JISで何バイトになるか システム連携、CSV、古い業務システム

5. 用途別:どの数字を見ればいい?

文字数と単語数は、どちらが正しいというよりも、用途によって見るべき指標が変わります。日本語の小論文なら文字数、英語エッセイなら単語数、SNSやフォームなら文字数制限、システム入力ならバイト数まで確認する、というように使い分けるのが実務的です。

用途 主に見る指標 補足
日本語レポート・小論文 文字数 空白・改行・参考文献を含めるかは提出先の指定を見る
英語エッセイ 単語数 Word Count指定がある場合は単語数を優先する
SNS投稿 文字数 URL、絵文字、改行の扱いはサービスごとに異なる
翻訳見積もり 日本語は文字数、英語は単語数 会社や案件によって基準が異なるため事前確認が必要
Webフォーム・システム入力 文字数、バイト数 全角半角、UTF-8、Shift_JISの違いに注意する

6. 日英混在文では「単語数」だけに頼らない

日本語と英語が混ざった文章では、単語数だけを見ても文章量を正確に把握しにくいことがあります。たとえば「ChatGPTで日本語の文字数を確認する」という文は、英語部分は単語として数えやすい一方、日本語部分はスペースで区切られていません。ツールによっては、日本語の連続部分を1単語のように扱うこともあります。

日英混在の文章では、単語数だけでなく、文字数、空白なし文字数、行数、段落数を合わせて見るのがおすすめです。AIプロンプトや多言語のSNS投稿では、さらにトークン数の考え方も関係します。トークン数については「トークンとは?意味・文字数との違い」でも解説しています。

7. 文字数カウントツールで確認するときのコツ

mojisucount.comに文章を貼り付けると、文字数、空白なし文字数、行数、段落数、バイト数などをまとめて確認できます。日本語の文字数を確認したい場合は「空白込み」と「空白なし」の両方を見て、提出先の基準に合わせます。英語の場合は、単語数とcharacter countを分けて確認すると、エッセイとフォーム入力のどちらにも対応しやすくなります。

特に、翻訳文やWebフォーム用の文章では、見た目の長さだけで判断しないことが大切です。日本語から英語にすると、同じ意味でも文字数や表示幅が増えることがあります。逆に、英語から日本語にすると文字数は短く見えても、漢字の密度が高くなり、読者には重く感じられることがあります。

8. まとめ

  • 日本語は文字数、英語は単語数が基準になりやすい。
  • 英語のcharacter countでは、スペース込みかスペースなしなのかを確認する。
  • 句読点、記号、全角半角、バイト数は、フォームやシステム入力で特に重要になる。
  • 日英混在文では、単語数だけでなく文字数・行数・段落数も合わせて見る。
  • 用途に応じて「文字数」「単語数」「バイト数」を使い分けると、文章量の判断ミスを減らせる。