GPT-Code-Clippy (GPT-CC)
Открытая версия GitHub Copilot, языковой модели на основе искусственного интеллекта
Что такое GPT-Code-Clippy (GPT-CC)?
GPT-Code-Clippy (GPT-CC) - открытая версия GitHub Copilot, модели глубокого обучения, основанной на GPT-3, известной как GPT-Codex, которая специально обучена на общедоступном коде с GitHub.
Датасет, использованный для обучения GPT-CC, был собран с помощью SEART GitHub Search на основе следующих критериев:
- 10+ звезд на GitHub
- 2+ коммита
- Должна быть лицензия
- Исключить форки
- Размер < 70708 байт
- Кроме того, включены репозитории из The Pile.
Более подробную информацию о проекте можно найти здесь: [https://discuss.huggingface.co/t/pretrain-gpt-neo-for-open-source-github-copilot-model/7678?u=ncoop57]
Читать на английском