ブログ解析フォーマットの大きな特徴
ブログ解析フォーマットの大きな特徴としては長い文章を書いた際に、段落を一つのまとまりとしてグラフに表示できる点にあります。主として3000文字以上のブログや商用ブロガー、ライターなどが使う事を想定したフォーマットです。
空白行(=改行2つ)〜空白行をひとつのまとまりとして、グラフに表示されます。
txt、docx形式に対応しています。doc形式には対応していません。
ただし、文章は読点と改行単位で分割され、管理されます。現在、「だよね。。。」のような表現は分割されてしまうため、不具合として対応中です。
中見出しについて
- 文の先頭に「●」「◯」「■」「□」のいずれかがあれば中見出しとして認識されます。中見出しはグラフ上にアノテーションとして表示されます。
- 中見出しの文を感情解析の対象としたくない(ただの注釈として使いたい、など)場合は、「◆」「◇」を先頭につけることで、グラフ上のアノテーションのみの用途として使うことができます。
会話文について
- 会話文については、「発言者:」のように、発言者の名前のあとにコロン(:)をつけると、その文は会話文として認識されます。
サンプルのダウンロード
以下のURLからダウンロードできます。
◆ブログ解析フォーマット
https://drive.google.com/file/d/1Ta_2Yy8C_m7LXKYnOXAYSzf8uymofWkg/view?usp=sharing