rfc-translater

開発者向け

要求定義

要件定義

動作環境

Python3 + Selenium (FireFox) on Windows / MacOS / Ubuntu (headless)

requests, lxml, beautifulsoup4, Mako, tqdm, seleniumなどのライブラリが実行に必要のためインストールしてください。Windowsの場合は、py -m pip に読み替えてください。

pip3 install -r requirements.txt

加えてSeleniumを動かすために以下のツールが実行に必要です。

実行コマンド例

注意:翻訳処理は非常に時間がかかります。1個のRFCを翻訳するのに短いものは5分、長いものは30分〜1時間程度かかります。 開発初期には複数のインスタンスを起動して同時並行で24時間回し続けたのを半年くらいしていました。

生成物:

ファイルパス 説明 生成元プログラム
html/data-rfc-list.json 廃止RFC・WGの一覧 fetch_wg.py (取得)
data/N000/rfcNXXX.json 段落区切りの文書 fetch_rfc.py(取得)
data/N000/rfcNXXX-trans.json 各文章の翻訳を付与した情報 trans_rfc.py(翻訳)
html/rfcNXXX.html 原文と翻訳を並べて表示するHTML make_html.py(生成)
html/index.html トップページの生成 make_index.py (生成)
data/draft/draft-*.json 段落区切りの文書 fetch_rfc.py(取得)
data/draft/draft-*-trans.json 各文章の翻訳を付与した情報 trans_rfc.py(翻訳)
html/draft/draft-*.html RFCドラフトの原文と翻訳を並べて表示するHTML make_html.py(生成)
html/draft/index.html RFCドラフト一覧のトップページHTML make_html.py(生成)

翻訳結果確認

ローカルで成果物の確認:

python3 -m http.server
# localhost:8000/htmlにアクセス

単体テスト

python3 -m unittest discover -s tests -p "test_*.py"

特定のテストのみ実施したい場合

python3 -m unittest tests.test_fetch_rfc.TestFetchRfcSectionTitle.test_section_title

Draft版の全RFCのHTMLを再作成する

find data/draft -name '*' -type f -exec /bin/bash -c '/opt/homebrew/bin/python3 main.py --draft $(basename {} -trans.json) --make' \;
python main.py --make-index-draft

その他

図表・ソースコードをJSONへ変換する

RFCを解析した結果、本来プログラムとして解釈すべき部分を文章として解釈してしまった場合、プログラムのインデントを削除してJSON化するツール: https://tex2e.github.io/rfc-translater/html/format.html