マジセミドライブ

ウェビナー関連のニュースやITサービス&ツールの最新情報を随時配信します。

OSS情報

2020.01.01

【OSS情報アーカイブ】BERT

【OSS情報アーカイブ】BERT

※当記事に記載されている情報は、古くなっている場合があります。オフィシャルサイトで最新情報をご確認ください。

コンテンツ

「BERT」とは

概要

BERT(バート)とは、自然言語処理(NLP)タスクの事前トレーニング手法です。事前トレーニングされたBERTモデルを1つの追加出力レイヤーで微調整することで、「質問応答」や「言語推論」などの幅広いタスクに対応する最先端のモデルを作成できます。Google Researchが中心となり開発が進められています。

基本説明

BERTは「Bidirectional Encoder Representations Transformers」の略称で、言語表現を事前にトレーニングする手法です。

自然言語処理(NLP)とは「言語翻訳」「センチメント分析」「セマンティック検索」「その他の数多くの言語タスク」などにまたがる人工知能(AI)のサブカテゴリです。

「汎用言語理解モデル」を大きなテキストコーパス(Wikipediaなど)で事前トレーニングし、そのモデルをNLPタスク(質問など)に使用します。

「ディープ双方向アプローチ」により、言語理解タスクにおいて、以前のトレーニング方法よりも高い精度に達しています。

オフィシャルサイト情報

■オフィシャルサイト

→arxiv.org →BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

■GitHub

→github.com →google-research/bert

■主要開発元

BERTは、Google Researchが中心となり開発が進められています。

→research.google

■ライセンス情報

BERTのライセンスは「Apache License 2.0」です。

詳細について、こちらを参照ください。
→github.com →google-research/bert →LICENSE

■動作環境

リポジトリ内のすべてのコードは「CPU」「GPU」「CloudTPU」ですぐに使用できます。

ただし、GPUトレーニングは単一GPUのみサポートしています。

■ダウンロード

→github.com →google-research/bert

高性能

BERTは、高い精度の結果を作成でき、11の自然言語処理タスクで最先端の結果を得られます。

・GLUEスコア:80.5%—7.7%改善
・MultiNLI精度:86.7%—4.6%改善
・質問応答テストF1:93.2ポイント—1.5ポイント改善
・SQuADv2.0テストF1:83.1ポイント—5.1ポイント改善

ディープ双方向アプローチ

BERTは、ディープニューラルネットワークの最下部から開始し、対象箇所の左側と右側の両方のコンテキストを使用する「ディープ双方向アプローチ」を採用しています。

入力内の単語の15%をマスクし、シーケンス全体をディープ双方向変成器エンコーダーで実行してから、マスクされた単語のみを予測します。

次に、大きなコーパス(Wikipedia+BookCorpus)で、モデル(12層から24層の変成器)を長時間トレーニングします。

事前トレーニング

事前トレーニングには、「4〜16のクラウドTPUで4日間ほど」のコストがかかりますが、言語ごとに1回限りの手順です。

■トレーニング済モデル

事前トレーニングモデルがリリースされています。

ほとんどのNLP研究者は、独自モデルを最初から事前トレーニングする必要はありません。

微調整カスタマイズ

微調整プロセスは短時間で完了できます。

「単一クラウドTPUで1時間ほど」もしくは「GPUで数時間ほど」で終了します。

例えば、SQuAD(スタンフォード質問応答データセット)の場合、単一クラウドTPUにおいて約30分でトレーニングでき、91.0%のDevF1スコアを達成できます。

参考元サイト

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

この記事のタグ一覧

おすすめの記事

【OSS情報】LLMトレーニング用ライブラリ「 GPT-NeoX 」📚

OSS情報

2024.07.18

【OSS情報】LLMトレーニング用ライブラリ「 GPT-NeoX 」📚

「 GPT-NeoX 」は、GPU上で大規模言語モデル(LLM)を効率的にトレーニングするためのライブラリです。NVIDIAのモデルを基に独自の最適化が加えられ、オートレグレッシブ言語モデルのトレーニング手法を集約しています。

【OSS情報】WebベースAPI開発スイート「 Hoppscotch 」🌐

OSS情報

2024.07.04

【OSS情報】WebベースAPI開発スイート「 Hoppscotch 」🌐

「 Hoppscotch 」は、オープンソースのAPI開発エコシステムで、使いやすさとアクセシビリティを重視した軽量なWebベースのスイートです。無料版と有料版があり、PostmanやInsomniaの代替として利用可能です。

経営活動に活用できる 原価管理 を実現するには? 〜製造業の現実的な課題に向き合い、現場視点から改善する原価管理手法の必達プロセスをご紹介〜

ウェビナーまとめ

2024.05.15

経営活動に活用できる 原価管理 を実現するには? 〜製造業の現実的な課題に向き合い、現場視点から改善する原価管理手法の必達プロセスをご紹介〜

2024年3月12日に三菱電機ITソリューションズ株式会社とアットストリームパートナーズ合同会社の共催で、組立加工製造業向けのセミナー「なぜか高くなる原価を管理する 不確実性の時代を乗り切るためのコスト戦略とは」が開催されました。本セミナーでは、製造業における原価管理の現状と改善手法について深く掘り下げ、経営活動への具体的な活用方法を提示しました。今回は、その講演の要点をお伝えします。