2020.12.18
2021.08.12
Fabeee社員ブログ
初めまして、E-LearningチームのPANです。
9月に入社して、いよいよブログの当番が回ってきました。
業務、事業の内容を題材とすることがルールなので、入社した以来やったことを振り返ると、中国語のAIコンテンツ(動画)の翻訳校正とSpringbootを用いての開発業務に携わってきました。
まあ…Springbootのことならグーグル先生に聞いた方がいいですし、独自性のあるテーマがみんなの好奇心を引き出せると思いまして、海外コンテンツの翻訳と校正についての記事が少ないので、こちらをテーマにしようと思います。
これから作業フロー、今まであった問題と対策、そして校正作業工数の見積もりについて順次記載していきますので、ご参考になればと思います。
目次
作業フロー
コンテンツの翻訳、校正に関わる作業フローは下記のようになります。
1. 翻訳チームがコンテンツプロバイダが提供したコンテンツを翻訳し、動画の字幕を制作して、字幕付きのコンテンツ動画を提出します。
2. 翻訳した内容の校正、注解を追加します。
3. コンテンツプロバイダへフィードバックします。
4. コンテンツプロバイダがフィードバックに基づいて改修します。
翻訳校正の作業が主に上記のステップ2と3に該当する感じになりますね。
もしあなたが将来ゼロから翻訳することになると、1から始まることになるでしょう。
今まであった問題と対策
■翻訳チームからいただいた訳文の文法の誤りが多く、クオリティの低さがネックに
→ 翻訳スキルの高い翻訳チームを頼むことにしました。
■講師の口癖まで機械的にそのまま翻訳され、訳文は文法的には違反していないが、文脈がおかしく意味がうまく伝わらない
(出来が良い機械翻訳のような感じ)
→ 翻訳チームにユーザー立場で自分が作った字幕を再確認することをお願いしました。具体的には、動画をミュートして、画面と字幕だけでコンテンツの内容を理解できるまで訳文を修正するように頼みました。そして校正作業する際、違和感のある文を自然な表現に直します。日本語が母国語ではない私にとっては、チャレンジ的な作業になります。T_T
■技術用語に関する間違い
多くの翻訳者が外国語専攻の方なので、技術についての知識を持たないのがほとんどなので、専門用語が多いコンテンツでは、翻訳間違いのケースも多くなります。例えば「ガウス分布」が「高速分布」に間違えられ、「決定木」が何かの発音が近い単語に勘違いて翻訳されている。など。
→ 校正作業もミュートで行うようにするので、違和感を感じれば音声で確認します。コンテンツの内容に関わる知識分野において、違和感に気づく程度の知識を持つのが必要です。
■初心者向けのコンテンツなのに、説明なしで専門用語が溢れ出る
→ 字幕注解で対応しようとしています。自分がわかっているものの、いかに知識を持たないユーザーでも分かりやすい注解を書くのがポイントになる気がしました。
校正作業所要時間の見積
この間の作業実績と経験に基づいて、一つのコンテンツの校正作業所要時間を数式でイメージすると、
こうなるかなと思います。
コンテンツの長さと注解の必要になる技術用語の個数が作業時間に大きい影響にかかると思います。
- Aは校正定数を表します。校正をする人の言語レベルやコンテンツの内容などによって変わります。
- yはコンテンツの長さを表します。よって、Ayの部分が文脈表現チェック、技術用語チェック、注解の選別にかかる時間になります。
- Tは一つの注解を作成(概念への理解と注解を書くことを含む)するための単位時間のようなものを表します。
- xは該当技術用語の注解を作成するための難易度を表し、nは注解の個数になります。
- Bは資料整理や相手(コンテンツプロバイダーや翻訳チームメンバーなど)とのやり取りするための、コンテンツ一つあたりの平均時間を表します。
T(X1+...+Xn)の部分について説明を少し補足します。仮にTを15(分)を設定し、X1は「周波数」、X2は「隠れマルコフモデル」の注解難易度になる場合、それぞれ0.5と2に設定したら、「周波数」の注解を作成する所要時間が7.5分、「隠れマルコフモデル」の注解を作成する所要時間が30分であることになります。実際見積もりする際には、Xを全部1にして、Tを平均時間にして、最後の結果を1.25のバッファーをかけたほうがいいかもしれません。
最後に
いかがでしたでしょうか。なかなかプロジェクトで翻訳をする機会はないかもしれませんが、
そのような状況に直面している方、今後直面しそうな方のお役に立てれば幸いです。