AI 分類を使用した Google ドライブファイルの自動ラベル付け

この機能でサポートされているアドオン: Gemini Enterprise、Gemini Education Premium、AI Security。 アドオンを比較する

AI 分類は、AI を使用して自動的に組織の機密コンテンツにラベルを付ける機能です。最初のトレーニング期間（AI モデルが機密コンテンツに関する組織の基準を学習する期間）を終えると、AI 分類によって Google ドライブ内の新しいファイルと既存のファイルの両方にラベルが自動的に適用されるようにできます。

AI 分類の使用を開始する方法は次のとおりです。

1）トレーニングを設定する: まず、[分類ラベル] を作成します。トレーニングが完了すると、AI モデルによってこのラベルがファイルに自動的に適用されるようになります。続いて [トレーニングラベル] も作成します。このラベルは分類ラベルとほぼ同じものです。

2）モデルをトレーニングする: トレーニング期間（通常およそ 1 週間）に、[ラベル付け担当者]（機密ファイルを評価できる組織内のユーザー）がトレーニングラベルを使ってドライブ内のファイルの分類を開始します。これらのサンプルをもとに、モデルは機密ファイルを同様に分類する方法を学習し始めます。

3）自動分類をオンにする: （およそ 1 週間後に）モデルのトレーニングが終わると、自動分類をオンにするよう求められます。分類されたファイルの数と精度は継続的にモニタリング可能です。

各フェーズの詳細については、下記のリンク付きのセクションをご覧ください。

始める前に

ドライブのラベルについてよくわからない場合は、ドライブのラベル管理者としての作業を開始するについての記事で、ラベルの仕組みと作成方法の詳細をご確認ください。
ラベル付け担当者用に組織内の残りのユーザーとは別の設定グループを作成することで、最適な結果が得られます。手順については、設定グループを使用してサービスの設定をカスタマイズするをご覧ください。

トレーニングを設定する

分類ラベルを作成する

分類ラベルは、トレーニング完了後に AI モデルによってドライブ内の機密ファイルに自動的に適用されるラベルです。モデルは、ラベルごとに 1 つのフィールドのみを使用してトレーニングされます。AI によって設定されたフィールドは、バッジ付きまたはオプションリストのフィールドタイプである必要があります。ラベルについて詳しくは、ドライブのラベル管理者としての作業を開始するをご覧ください。

分類ラベルとして使用する場合は、オプションリストまたはバッジ付きフィールドが次の要件を満たしている必要があります。

オプションの数を 2～7 個にする
公開する

これらの要件を満たすラベルがすでにある場合は、それを分類ラベルとして使用できます。ラベルがない場合は、ラベルを作成します。

トレーニングラベルを作成する

トレーニングラベルは、ラベルの選択（次のステップ）で自動的に作成できるため、その際に作成することをおすすめします。これにより、トレーニングラベルが必要なすべての方法で分類ラベルと一致することが保証されます。

ラベルの選択前にトレーニングラベルを作成する場合:

ラベルが必要なラベルの条件を満たしていることを確認します。
トレーニングラベルに「トレーニング」という言葉を付けておけば、トレーニング期間中に信頼できるラベル付け担当者がそのラベルを認識し、適用しやすくなります。
トレーニングラベルに説明フィールドを追加しておくことで、信頼できるラベル付け担当者にそのラベルの目的を理解してもらいやすくなります。

ラベルを選択してトレーニングを有効にする

Google 管理コンソールにログインします。
管理者アカウント（末尾が @gmail.com でないもの）でログインします。
管理コンソールで、メニューアイコン [セキュリティ] [アクセスとデータ管理] [データ分類] [ラベルマネージャー] に移動します。
Google ドライブの AI 分類で、[トレーニングの設定] をクリックします。
[分類ラベルの選択] で、[ラベルを選択] をクリックします。
AI 分類で使用するラベルと、設定するフィールドを選択します。
[トレーニングラベルの選択] で、[トレーニングラベルを作成] をクリックします。
これにより、分類ラベルと同じ属性を持つトレーニングラベルが自動的に作成されます。
ラベル付け担当者が新しいラベルを使用できるようにするには、[ラベルの権限を更新] をクリックします。別のタブでラベルマネージャーにラベルが編集モードで開きます。
注: ラベルの権限は後で設定することもできます。ただし、トレーニングラベルにアクセスできるのはラベル付け担当者のみにすることが重要です。
[権限] [編集] をクリックして、ラベル付け担当者が含まれる設定グループに [ラベルの適用と値の設定が可能] 権限を付与します。
[保存] をクリックして、ラベルマネージャータブを閉じます。
分類ラベルとトレーニングラベルの両方を選択すると、[トレーニングを有効にする] ボタンが有効になります。
[トレーニングを有効にする] をクリックします。
重要: トレーニングを有効にしようとしたときにエラーメッセージが表示された場合は、分類ラベルとトレーニングラベルが一致していません。以下のラベルの要件を確認し、ラベルがすべての要件を満たしていることを確認してから、トレーニングを有効にします。

トレーニングを有効にすると、[データ分類] ページに、選択したトレーニングラベルと分類ラベルが表示されます。

分類ラベルに [まだ準備ができていない] と表示されている。トレーニングが完了すると、ラベルのステータスが [準備完了] に変わります。
[自動適用ステータス] に [オフ（すべてのユーザー）] と表示されます。分類ラベルのステータスが [準備完了] になったら、[自動適用のステータス] を [オン] に変更できます。

続いて、ラベル付け担当者が、機密ファイルへのトレーニングラベルの適用を開始する必要があります。

モデルをトレーニングする

AI モデルを正常にトレーニングするには、ラベル付け担当者が各オプションにつき少なくとも 100 ファイルにラベルを付ける必要があります。たとえば、ラベルに 3 つのオプションがある場合は、合計 300 以上のファイルにラベルを適用する必要があります。AI モデルは 1～2 週間ごとにトレーニングを確認し、各ラベルオプションにつきサンプル数が 100 件以上になると [準備完了] と表示されます。高品質のサンプルについての詳細もご確認ください。

トレーニング期間中、ラベル付けされたファイルの数とモデルの精度の向上状況を確認できます。

注: トレーニングファイルの総数の上限は 100 万です。

トレーニング期間中の進行状況を確認するには:

管理コンソールで、[セキュリティ] [データ分類] に移動します。
[モデルの詳細を表示] をクリックします。
- [トレーニングラベル] の [トレーニングファイル] には、各オプションにラベルが付けられたファイルの数が表示されます。
- 各ラベルオプションには、モデルがテスト後に正しく分類したトレーニングサンプルの割合を示す「スコア」が付いています。
  - 低 - 50% 未満。モデルに適切なデータがないため、まだ準備ができていません。
  - 中 - 50～80%。モデルの準備が限定的に整っている可能性があります。
  - 高 - 80% 超。このモデルは組織のファイルを分類する準備が整っています。

ラベルの自動適用を有効にする

高レベルの精度を実現できるように AI モデルをトレーニングしたら、ラベルオプションを選択してラベルの自動適用を有効にできます。手順は次のとおりです。

管理コンソールで、[セキュリティ] [データ分類] に移動します。
[AI 分類] で、[分類ラベル] のステータスが [準備完了] であることを確認します。
[モデルの詳細を表示] をクリックします。
[分類ラベル] で、AI モデルに自動適用を許可するラベルオプションのチェックボックスをオンにします。
[自動適用を有効化] をクリックします。
ラベルを自動的に適用するユーザーメンバーが含まれている組織部門またはグループを検索して選択します。たとえば、「財務」というグループを選択し、次にその「財務」グループに対して設定するラベルを選択します。
[オン - ラベルの自動適用] をクリックします。
ラベルの適用方法のオプションは [オン] オプションの下に表示されます。
[保存] をクリックします。
データ分類のメインページで、ルールの [自動適用のステータス] が [オン] に変わります。

AI 分類はいつファイルをスキャンしますか？

AI 分類は、自動適用が有効になっているユーザーと共有ドライブに対して、少なくとも 1 回は保存中のファイルをスキャンします。このプロセスは、自動適用を最初に有効にしてから 1～2 週間かかる場合があります。

AI 分類は、ファイルのアップロード時や変更時にもファイルをスキャンします。適用されたラベルは、ファイルのコンテンツの変更に応じて変更される場合があります。

ドライブのログに記録された AI 分類ラベルのイベントをモニタリングする

ドライブのログに記録されたイベントを確認することで、AI 分類によるファイルのラベル付けについての詳細を確認できます。

[セキュリティ] [データ分類] に移動します。
Google ドライブの AI 分類で、[モデルの詳細を表示] をクリックします。
[ログを表示] をクリックします。
新しいタブでセキュリティ調査ツールが開き、[ラベルの適用] と [ラベルフィールドの値の変更] という AI 分類関連の 2 つのイベントに関するドライブのログの検索結果が表示されます。
イベントの [説明] をクリックすると、次のような詳細情報が表示されます。
- ラベル付けされたドキュメントの名前とタイプ
- ドキュメントに割り当てられたラベルフィールドの値（例: ラベルオプションである場合は [機密] や [制限付き] など）。

ラベルの自動適用を無効にする

すべてのラベルまたは一部のオプションに対する自動適用を無効にできます。

[セキュリティ] [データ分類] に移動します。
Google ドライブの AI 分類で、[モデルの詳細を表示] をクリックします。
- [分類ラベル] で、[自動適用] 列の [許可] をオフにして、そのオプションの自動適用を停止します。
- 自動適用を完全に停止するには、すべてのオプションのチェックボックスをオフにしてください。

特定の組織部門またはグループに対して自動適用を完全にオフにする

特定の組織部門またはグループのユーザーが所有するコンテンツに対して自動適用を完全に無効にする場合は、このオプションを使用します。

[セキュリティ] [データ分類] に移動します。
Google ドライブの AI 分類で、[モデルの詳細を表示] をクリックします。
[自動適用を管理] をクリックします。
左側の組織部門またはグループをクリックして選択します。
[AI による自動適用の管理] で [オフ] をクリックします。

モデルをリセットする

ある時点でモデルをリセットする必要がある場合があります（別のテストを開始する場合や、モデルの精度が向上しない場合など）。モデルをリセットする必要がある場合は、次の点に注意してください。

モデルをリセットした場合は、モデルのトレーニングが終了するまで待ってから、AI 分類で新しい分類ラベルを有効にしてファイルに適用します。
以前に適用されたトレーニングラベルはファイルに残ります。モデルをリセットした後、同じトレーニングラベル（または別のラベル）を使用するように新しいモデルを構成できます。
モデルをリセットした後も、自動的に適用されたラベルはファイルに残ります。
新しいモデルで同じ分類ラベルを選択すると、AI 分類機能は以前のモデルの予測を無視して上書きします。このように、モデルをリセットすることで組織のドライブファイルを「再処理」できます。この機能は、最初のデプロイ以降にモデルの品質を大幅に改善した場合に便利です。

[セキュリティ] [データ分類] に移動します。
Google ドライブの AI 分類で、[モデルの詳細を表示] をクリックします。
AI モデルの詳細ページで、右側の [アクション] の [モデルをリセット] をクリックします。
[モデルをリセット] ダイアログに、モデルのリセットによる影響が一覧表示されます。
続行するには、[モデルをリセット] をクリックします。
AI 分類が初期状態にリセットされます。再起動するには、[トレーニングの設定] をクリックして、新しい分類ラベルとトレーニングラベルを選択します。

よくある質問

すべて開く | すべて閉じる

トレーニングラベルと分類ラベルにはどのような要件がありますか？

分類ラベルとトレーニングラベルの両方が次の条件を満たしている必要があります。

オプションの数が 2～7 個である。
オプションの順序は各ラベルで同じである必要があります。たとえば、分類ラベルに次の順序でオプションが設定されているとします。
トレーニングラベルのオプションを次の順序で設定することはできません。
- 1. オプション 1
- 2. オプション 2
- 3. オプション 3
- 1. オプション 2
- 2. オプション 1
- 3. オプション 3
公開済みのラベルがある。
ラベルに異なるアクセス権限が設定されている。トレーニングラベルを使用できるのは、モデルのトレーニング担当として信頼されているラベル付け担当者のみにする必要があります。分類ラベルへのアクセス権限はもっと広範に設定できます。

分類ラベルをトレーニングラベルとして使用することは可能ですか？

いいえ。分類ラベルとトレーニングラベルは分ける必要があります。分類ラベルとして選択したラベルは、トレーニングラベルの選択肢として表示されません。

モデルのトレーニングに適しているのはどのようなファイルですか？

モデルのトレーニングで最良の結果を得るには、信頼できるラベル付け担当者がトレーニングファイルを選択する際に、次のガイドラインに沿う必要があります。

各ファイルの文字数を 500 文字以上にする。
組織内でユーザーが作成、共有、使用する実際のコンテンツを最もよく表すファイルを選択する。
各ラベルオプションで選択するファイルをほぼ同数にする。各オプションにつき少なくとも 100 ファイルを選択します。こうすることで、モデルがデータを包括的に理解しやすくなり、スコアが向上します。
オプションのタイプごとに代表的な各種ファイルを含める。たとえば、契約書も組織内で一般的に機密扱いになっているのであれば、100 通の履歴書のみを機密ファイル形式の代表例とすることは避けてください。

AI 分類は、機密コンテンツのみにラベルを付けるために使用できますか？

主要な機能は機密コンテンツのラベル付けですが、付いているオプションが 4 つまでのラベルであればどれでも、自動ラベル付け用にトレーニングできます。

モデルは複数の言語でトレーニングできますか？

このモデルは複数の言語をサポートしていますが、トレーニングデータには、オプションのタイプと言語ごとに代表的な各種ファイルを含める必要があります。これにより、モデルを正常にトレーニングするために必要なファイルの数が増えます。単語の境界線のない表記法（日本語や中国語など）はまだサポートされていません。

スコアはどのように算出されるのですか？

トレーニング中、AI モデルは入力データの 75% を使用してファイルにラベルを付ける方法をトレーニングし、25% を自身のパフォーマンスを定期的にテストするために確保します。つまり、ラベル付きファイルの 25% については、どのラベルが適用されているのかを知らないかのようにファイルを分析します。次に、AI モデルは独自のラベル選択を行い、ラベル付け担当者によって適用された実際のラベルと比較します。スコアは、リザーブされているファイルのうち適切なラベルが正しく割り当てられた割合を示しています。

自動適用が無効になっているオプションを変更するとどうなりますか？

スキャン中に、自動適用が無効になっているオプションがファイルに含まれていると予測された場合、AI 分類はラベルまたはフィールドの値をファイルに適用しません。

AI 分類で以前にラベルが付けられたファイルでは、オプションが無効になった後も、適用されたラベルとオプションの値が保持されます。

AI Classification は、自動適用されたラベルをどのように、いつ修正しますか？

モデルの作成と自動適用の有効化が完了すると、AI 分類は、十分なテキストを抽出できるすべての保存済みファイルをスキャンして分類します。これらのファイルは少なくとも 1 回スキャンされます。

AI 分類は、コンテンツの変更に伴い、ファイルを定期的に再処理します。コンテンツが変更されると、ファイルの予測結果が異なる場合があります。AI 分類にファイルの予測オプションが古いものと新しいものの両方がある場合、オプションリストの上位にあるオプションが優先されます。たとえば、ラベルマネージャーのフィールドに次の 3 つのオプションがあるとします。

機密
内部
一般公開

AI 分類がファイルを [内部] として分類しており、AI 分類モデルが [機密] と予測されるようなコンテンツの変更があったとします。この場合、ファイルの分類は [機密] に変更されます。ただし、AI 分類モデルが [公開] を予測した場合、ファイルの分類は [内部] のままになります。

自動適用されたラベルと、ユーザーが確認または変更したフィールド値は、AI 分類では変更されません。

AI、DLP ルール、デフォルトの分類など、複数の分類メカニズムがある場合、ファイルの分類に優先されるメカニズムは何ですか？

データ分類は次の順序で行われます。

ユーザーによる上書きを許可しない DLP ルール
手動による分類
ユーザーによる上書きが可能な DLP ルール
AI 分類
デフォルトの分類

ラベルまたはフィールドを削除すると、下位階層の分類メカニズムが有効になります。たとえば、ユーザーがラベルを削除したファイルに、後で AI 分類によって同じラベルが自動的に適用されることがあります。

ラベルを適用できるファイル形式に制限はありますか？

ドライブのアイテムには、ドライブからラベルを付けることができます。エディタには、ネイティブのラベリング UX もあります。
AI 分類では、ドライブの DLP と同じインデックス化可能なテキスト処理が使用されます。ドライブがインデックス登録可能なテキストを抽出できるファイルには、AI 分類ラベルを適用できます。すべてのファイルからインデックス登録可能なテキストを抽出できるわけではないため、AI 分類ですべてのファイルを処理できるわけではありません。
AI 分類では、分類の決定を行う前に、ファイルが最小テキストしきい値を満たしている必要があります。そのため、非常に短いドキュメントやテキスト量の少ない画像など、一部のファイルは分類されない場合があります。

対象となるライセンスを持っていないユーザーがこの機能を利用するにはどうすればよいですか？

ドメイン内の一部のユーザーが AI 分類をサポートするライセンスを所有している限り、管理者はモデルをトレーニングできます。トレーニングラベルが付いたファイルは、ドライブラベルに対応したライセンスを持つユーザーであれば誰でも所有できます。自動適用機能は、AI 分類がサポートされているライセンスのあるユーザーが所有するファイルにのみラベルを適用します。サポートされているライセンスのないユーザーが所有するファイルは、AI によって処理されません。

この情報は役に立ちましたか？

改善できる点がありましたらお聞かせください。

AI 分類を使用した Google ドライブファイルの自動ラベル付け

始める前に