yura_graph➦Kelavrik_0• 28.10.20 00:13
Кафедру теологии в МФТИ закрыли.
Ну не может кафедрой заведовать регент.
А вот полетом на Луну - может.
yura_graph➦Хренонимус• 27.10.20 23:23
А если после школы сразу болталки будет писать - он должен на элементарные вопросы отвечать?
Хренонимус ★➦yura_graph• 27.10.20 23:54
Юра, я что-то коментарий твой не понял. Слова понятные - смысл ускользает.
Я правильно понял, что Сбер выложил датасет для GPT-3?
Ну выложил и выложил - на чем-то этого робота тренировать нужно. Вопрос релевантности и чистоты датасета для поставленной задачи.
Ну и на чем их только не тренируют. Где-то был сайт с ебнутым AI - тренировали на чернухе, кажется. Да и эти общие датасеты тоже с приколами - был недавно скандал, когда датасет для распознавания фото был с тэгами а-ля наркоманка-проститутка.
yura_graph➦Хренонимус• 28.10.20 00:01
Привет! Слушай, в статье написано, что на текущий момент это - самый большая модель для GPT-3 для всех языков мира.
На русском там 700 ГБ различных текстов в качестве тренировочного использовано. Но факт даже не в этом, рядом лежит меньшая модель, под видяху 1080 - так вот текст сгенерен именно ей. Ей дали мысль (это первая строка) "Официальный представитель NASA заявил, что Гагарин не был в космосе" и она продолжила.
Об этом и рассказ.)
Хренонимус ★➦yura_graph• 28.10.20 00:18
Салют! Разъяснил, спасибо.
Мое персональное мнение в рамках AI - очередная блажь тыкать робота всюду и решать административные проблемы техническими средствами.
Но, полагаю, болталка это только одна из сотен/тысяч персоналий и как бы не оказалось, что это в очередной раз ПР опозорил ИТшников и аналитиков, которые дают 99% нагрузки, но датасеты с которыми они работают в публичный доступ никто не выложит.
Легко можно представит такой брэйнсторминг;
- МС открытый датасет выложила, гугл! Нам тоже нужно! ИТшники, решайте! У вас там этой АйЯй есть!
- Бля, у нас датасеты по всяким чувакам и их транзакциям, связям с фирмами и п.р. для АМЛ! Выложить?! К нам очередь с гранатометами будет стоять в тот же день!
- Ниибет! Надо решать! Лицо! Репутация! Благо! Развитие!
- Бля, скиньте им датасет для нашего чат-бота, пусть отъебутся!