Поддерживаемые дополнения для этой функции: Gemini Enterprise, Gemini Education Premium и AI Security. Сравнение дополнений
Функция классификации с помощью ИИ автоматически добавляет ярлыки к конфиденциальному контенту организации. После первоначального периода обучения модели ИИ критериям вашей организации в отношении конфиденциального контента функция классификации с помощью ИИ сможет автоматически применять ярлыки к новым и существующим файлам на Google Диске.
Вот как начать использовать классификацию с помощью ИИ:
1. Настройте обучение. Сначала создайте ярлык для классификации, который модель ИИ будет автоматически применять к файлам после завершения обучения. Вы также можете создать ярлык для обучения, который практически идентичен ярлыку для классификации.
2. Обучите модель. Во время периода обучения, который обычно длится около недели, назначенные вами доверенные пользователи – сотрудники, которые могут оценивать конфиденциальные файлы, – будут классифицировать файлы на Диске, применяя ярлык для обучения. На основе этих образцов модель обучится классифицировать похожие конфиденциальные файлы.
3. Включите автоматическую классификацию. Когда обучение модели будет завершено (примерно через неделю), вам будет предложено включить автоматическую классификацию. Вы сможете отслеживать, сколько файлов было классифицировано и с какой точностью.
Точные сведения о каждом этапе приведены в разделах ниже, на которые указывают ссылки.
Подготовка
- Если вы не знакомы с принципами работы ярлыков Диска и не знаете, как их создать, прочитайте статью Как начать работу с ярлыками Диска (для администраторов).
- Для наилучших результатов создайте отдельную группу конфигурации для доверенных пользователей. С инструкциями можно ознакомиться в статье Как настраивать сервисы с помощью групп конфигурации.
Как настроить обучение
Как создать ярлык для классификации
Модель ИИ будет автоматически применять ярлык для классификации к конфиденциальным файлам на Диске, когда завершится ее обучение. Модель использует для обучения и применяет только одно поле для одного ярлыка Поле, заданное с помощью ИИ, может быть либо полем со значком, либо полем со списком вариантов. Подробная информация о ярлыках приведена в статье Как начать работу с ярлыками Диска (для администраторов).
Поле со значком или со списком вариантов, которое используется в качестве ярлыка для классификации, должно соответствовать следующим требованиям:
- Минимум 2 и максимум 7 вариантов.
- Должно быть опубликовано.
Если у вас уже есть ярлык, который соответствует этим требованиям, вы можете использовать его для классификации. В противном случае создайте его.
Как создать ярлык для обучения
Рекомендуем создать ярлык для обучения на этапе выбора ярлыка – это можно сделать автоматически. Тогда ярлык будет соответствовать всем требованиям к ярлыку для классификации.
Если вы выберете создание ярлыка для классификации до его выбора:
- Убедитесь, что ярлык соответствует критериям.
- Обозначьте ярлык словом "обучение", чтобы доверенным пользователям было проще его узнать и применить в период обучения.
- Для удобства доверенных пользователей добавьте поле описания к ярлыку для обучения.
Как выбрать ярлыки и запустить обучение
-
Войдите в консоль администратора Google.
Войдите в аккаунт администратора (он не заканчивается на @gmail.com).
-
В консоли администратора нажмите на значок меню Безопасность Управление доступом и данными Систематизация данных Label manager.
- В разделе классификации с помощью ИИ для Google Диска нажмите Настройка обучения.
- В разделе Выбор ярлыка классификации нажмите Выбрать ярлык.
- Выберите ярлык, который ИИ должен использовать для классификации, и поле, которое будет задано.
- В разделе Выбор ярлыка обучения нажмите Создать ярлык для обучения.
Будет автоматически создан ярлык для обучения с теми же атрибутами, что и у ярлыка для классификации.
- Чтобы новый ярлык был доступен доверенным пользователям, нажмите Обновить разрешения для ярлыка. Ярлык откроется в режиме редактирования в Label Manager на отдельной вкладке.
Примечание. Вы также можете настроить разрешения для ярлыка позже. Однако важно, чтобы у доверенных лиц был доступ к ярлыку для обучения.
- Нажмите РазрешенияИзменить, а затем предоставьте разрешение Применение ярлыков и присвоение значений для них группе конфигурации, в которую добавлены доверенные пользователи.
- Нажмите Сохранить и закройте вкладку Label Manager.
Когда вы выберете и ярлык для классификации, и ярлык для обучения, активируется кнопка Включить обучение.
- Нажмите Включить обучение.
Важно! Если при попытке включить обучение появится сообщение об ошибке, это означает, что ярлык для классификации и ярлык для обучения не соответствуют друг другу. Ознакомьтесь с требованиями к ярлыкам ниже и обеспечьте выполнение этих требований, а затем снова попробуйте включить обучение.
Когда вы включите обучение, на странице классификации данных появятся выбранные вами ярлык для обучения и ярлык для классификации.
- Ярлык для классификации имеет статус Не готов. После обучения статус изменится на Готов.
- У параметра Статус автоматического применения отображается значение Отключено для всех. Когда у ярлыка для классификации будет статус Готов, вы сможете изменить значение параметра "Статус автоматического применения" на Включено.
Затем доверенным пользователям нужно будет начать применять ярлык для обучения к конфиденциальным файлам.
Как обучить модель
Чтобы обучить модель ИИ, доверенные пользователи должны добавить ярлыки не менее чем к 100 файлам для каждого варианта. Например, если у ярлыка три варианта, его нужно применить не менее чем к 300 файлам. Модель ИИ проверяет объекты для обучения каждые 1–2 недели. Когда она пройдет обучение на основе 100 примеров для каждого из вариантов ярлыка, ее статус изменится на Готово. Подробнее о высококачественных примерах…
В течение периода обучения вы можете проверять количество файлов, которым был присвоен ярлык, и узнавать, как повышается точность модели.
Примечание. Для обучения можно использовать не более миллиона файлов.
Чтобы отслеживать процесс обучения:
- В консоли администратора выберите БезопасностьКлассификация данных.
- Нажмите Посмотреть информацию о модели.
- В разделе Ярлык для обучения параметр Файлы для обучения показывает количество файлов, которым был присвоен каждый вариант ярлыка.
- У каждого варианта ярлыка есть параметр "Оценка", показывающий процент примеров для обучения, которые модель классифицировала правильно по результатам самопроверки.
- Низкая – менее 50 %. Модели нужны более качественные данные. Она ещё не готова.
- Средняя – от 50 до 80 %. Модель готова, но ее возможности ограничены.
- Высокая – более 80 %. Модель готова классифицировать файлы вашей организации.
Как включить автоматическое применение ярлыков
После обучения модель ИИ должна обеспечивать высокий уровень точности, так что вы можете выбрать варианты ярлыков и включить их автоматическое применение. Выполните указанные ниже действия.
- В консоли администратора выберите БезопасностьКлассификация данных.
- В разделе Классификация с помощью ИИ убедитесь, что для параметра Ярлык для классификации указан статус Готово.
- Нажмите Посмотреть информацию о модели.
- В разделе Ярлык для классификации установите флажки для вариантов ярлыка, которые модель может применить автоматически.
- Нажмите Включить автоматическое применение.
- Найдите и выберите организационное подразделение или группу, для пользователей которой нужно включить автоматическое применение ярлыков. Например, если вы выберете группу "Финансовый отдел", то затем сможете выбрать ярлыки, которые нужно применять к новым файлам ее пользователей.
- Нажмите Вкл – ярлыки будут применяться автоматически.
Варианты применения ярлыка указаны под параметром "Вкл".
- Нажмите Сохранить.
- На главной странице "Классификация данных" значение Статус автоматического применения для правила изменится на Вкл.
Когда функция классификации с помощью ИИ сканирует файлы?
Функция классификации с помощью ИИ, по меньшей мере, по одному разу сканирует файлы, хранящиеся в аккаунтах пользователей и на общих дисках, для которых включено автоматическое применение. Этот процесс может занять 1–2 недели после первого включения автоприменения.
Функция классификации с помощью ИИ также сканирует файлы при загрузке и изменении. После изменения контента файла может быть назначен другой ярлык.
Как отслеживать события классификации с помощью ИИ в журнале Диска
Вы можете получить подробную информацию о том, как добавлять ярлыки с помощью классификации, изучив события, записанные в журнале Диска.
- Выберите БезопасностьКлассификация данных.
- В разделе классификации с помощью ИИ для Google Диска нажмите Посмотреть информацию о модели.
- Выберите Посмотреть журналы.
В новой вкладке откроется инструмент "Анализ безопасности", в котором будут показаны результаты поиска в журнале Диска двух событий, связанных с классификацией с помощью ИИ: Ярлык применен и Значение поля "Ярлык" изменено.
- Выберите Описание для события, чтобы ознакомиться с дополнительными сведениями, например:
- Название и тип документа, к которому был применен ярлык.
- Значение поля ярлыка, назначенного документу (например, "Конфиденциально" или "Доступ ограничен", если используются соответствующие варианты ярлыков).
Как отключить автоматическое применение ярлыков
Вы можете отключить автоматическое применение всех ярлыков или только определенных вариантов.
- Выберите БезопасностьКлассификация данных.
- В разделе классификации с помощью ИИ для Google Диска нажмите Посмотреть информацию о модели.
- В разделе Ярлык для классификации в столбце "Автоматическое применение" снимите флажки Разрешить для нужных вариантов.
- Чтобы полностью приостановить автоматическое применение, снимите все флажки.
Используйте этот вариант, если хотите полностью отключить автоматическое применение для контента, принадлежащего пользователям в определенных организационных подразделениях или группах.
- Выберите БезопасностьКлассификация данных.
- В разделе классификации с помощью ИИ для Google Диска нажмите Посмотреть информацию о модели.
- Нажмите Настроить автоматическое применение.
- Нажмите на организационное подразделение или группу, чтобы выбрать ее.
- В разделе Управление автоматическим применением ярлыков с помощью искусственного интеллекта нажмите ВЫКЛ.
Как сбросить параметры модели
Возможно, в определенный момент вам понадобится сбросить параметры модели (например, чтобы начать новую проверку или из-за того, что точность модели не повышается). Если вам нужно сбросить параметры модели, обратите внимание на следующее:
- Если вы сбросите параметры модели, вам нужно будет дождаться завершения обучения, прежде чем будет доступен новый ярлык для классификации и функция классификации с помощью ИИ сможет применять его к файлам.
- Ранее примененные к файлам ярлыки для обучения не удаляются. После сброса параметров модели вы можете решить настроить новую модель, чтобы использовать тот же ярлык для обучения (или другой).
- Автоматически примененные к файлам ярлыки не удаляются, пока вы не сбросите параметры модели.
- Если вы выберете для новой модели тот же ярлык для классификации, при его применении прогнозы предыдущих моделей не будут учитываться и будут перезаписаны. Таким образом, сброс параметров модели можно использовать для повторной обработки файлов организации на Диске. Это может быть полезно, если вы значительно повысили качество модели после первоначального развертывания.
- Выберите БезопасностьКлассификация данных.
- В разделе классификации с помощью ИИ для Google Диска нажмите Посмотреть информацию о модели.
- На странице сведений о модели ИИ в разделе Действия справа нажмите Сбросить настройки.
В диалоговом окне Сбросить настройки будут указаны последствия этого действия.
- Чтобы продолжить, нажмите Сбросить настройки.
Функция классификации с помощью ИИ вернется в свое первоначальное состояние. Чтобы запустить ее заново, нажмите Настройка обучения и выберите новые ярлыки для классификации и обучения.
Часто задаваемые вопросы
Какие требования к ярлыкам для обучения и классификации?Оба вида ярлыков должны соответствовать следующим критериям:
- Включать от 2 до 7 вариантов.
- Иметь одинаковый порядок вариантов. Пример
В ярлыке для обучения варианты нельзя размещать следующим образом:
- 1. Вариант 1
- 2. Вариант 2
- 3. Вариант 3
- 1. Вариант 2
- 2. Вариант 1
- 3. Вариант 3
- Содержать опубликованные ярлыки.
- Содержать ярлыки с разными настройками доступа. Ярлык для обучения должен быть доступен только доверенным пользователям. К ярлыку для классификации можно предоставить более широкий доступ.
Чтобы получить наилучшие результаты при обучении модели, попросите доверенных пользователей соблюдать следующие рекомендации при выборе файлов для обучения:
- Убедитесь, что в каждом файле не менее 500 текстовых символов.
- Выберите файлы, которые наилучшим образом представляют фактический контент, который сотрудники создают, публикуют и используют.
- Выберите примерно одинаковое количество файлов для каждого варианта ярлыка и не менее 100 файлов для каждого варианта. Это поможет модели получить комплексное представление о данных и обеспечить более высокую точность.
- Включите репрезентативную выборку файлов для каждого варианта. Например, не помечайте 100 резюме как общий набор примеров файлов для варианта "Совершенно секретно", если в вашей организации к нему также относятся контракты.
У файлов, ранее помеченных функцией классификации с помощью ИИ, примененный ярлык и значения вариантов сохранятся даже после отключения варианта.
После создания модели и включения автоприменения функция автоматической классификации с помощью ИИ сканирует и классифицирует все файлы при хранении, для которых можно извлечь достаточный объем текста. Эти файлы сканируются, по меньшей мере, один раз.
Функция классификации с помощью ИИ время от времени обрабатывает файлы повторно по мере внесения изменений в контент. При изменении контента прогноз для файла может измениться. Если в распоряжении функции классификации с помощью ИИ есть и старые, и новые спрогнозированные варианты для файла, будет выбран тот, что находится выше в списке. Например, в поле в Label Manager есть три значения:
- Конфиденциально.
- Для внутреннего пользования.
- Для общего пользования.
Допустим, функция классификации с помощью ИИ назначила файлу ярлык Для внутреннего пользования, а после изменения контента – Конфиденциально. В таком случае классификация для файла изменится на Конфиденциально. Однако если модель классификации с помощью ИИ прогнозировала ярлык Для общего пользования, у файла останется ярлык Для внутреннего пользования.
Функция классификации с помощью ИИ не пересматривает автоматически примененные ярлыки и значения полей, которые ранее проверили или изменили пользователи.
- правило DLP без перезаписи пользовательского значения;
- классификация вручную;
- правило DLP с перезаписью пользовательского значения;
- классификация с помощью искусственного интеллекта;
- классификация по умолчанию.
- Ярлыки можно применять к любым хранящимся на Диске файлам, используя интерфейс сервиса. В редакторе также есть встроенные функции для работы с ярлыками.
- Функция классификации с помощью ИИ обрабатывает индексируемый текст так же, как и правила DLP Диска. Любой файл, из которого Диск может извлечь индексируемый текст, может быть обработан функцией классификации с помощью ИИ для применения ярлыков. Извлечь индексируемый текст из каждого файла невозможно, поэтому не гарантируется, что функция сможет обработать все файлы.
- Для успешного применения функции классификации с помощью ИИ необходимо, чтобы в файле было определенное минимальное количество текста. Поэтому некоторые файлы, например маленькие документы и изображения с небольшим количеством текста, не будут классифицированы.