Скромная газетка Юдзи

Обратно

ИИ; Сериал Восхождение; Хакафон!

10 марта, 2025

Доброго времени суток! Прежде вы продолжите читать данную статью, важно отметить что в ней будет огромное (ОЧЕНЬ) количество технической информации и ультра большое количество математики. Будьте адекватнее и просто скипайте куски проф. инфы если вам скучно.



NeuroYDZ3 - Открытая бэта!


ВНИМАНИЕ!!!! ЭТО НЕ ИНСТРУКЦИЯ! ТУТ МНОГО ДОПУЩЕНИЙ!

Моя нейросеть NeuroYDZ3 (Или Нейроюдзия) доступна для общего пользования без каких либо ограничений! Это один из моих самых тяжелых и долгих проектов, и в этом блоке я расскажу все что нужно о ней знать, чтобы пользоваться. Увы и ах - ее я не хочу делать opensource, по этому скачать ее и запустить локально не получиться. Но, я сделал телеграм бота который может с ней взаимодействовать, перенаправляя запросы туда и сюда. Так же, важно отметить ни бот, ни нейросеть - НЕ СОБИРАЮТ О ВАС НИКАКИЕ ДАННЫЕ. Ваша переписка с ботом - нигде и никак не хранится. Так же, важно отметить ее ограничения: Она никак не помнит вашу переписку, не зпоминает прошлые промпты, а так же, она НЕ напишет за вас код. Но - она очень хороша в решении как логических задач, а так же может доступно рассказать вам любую тему, но при этом всем, я встроил в нее цензуру чтобы та не могла снести мне бота из-за инструкций по терроризму.

Как она работает?

Токенизация - каждое слово соответствует своему токену, которые генерируются динамично. В отличии от других LLM у которых есть база данных, тут ее нет и все храниться в хаотичных "боксах". Это мое изобретение, это четырехмерная матрица состоящая из трехмерных матриц состоящих их двухмерных матриц из чисел с запятой без строгой типизации. Генерация токенизированного контекста состоит из очень сложного алгоритма исходящего из математической формулы, который выглядит так:


Теперь, токены нужно превратить в векторы (t\/i это токен):

Далее мы шифруем их по филологическому порядку, и делаем математическую базу данных key/value/query для связывания слов. В отличии от баз данных которые хранят информацию не в цифрах (bigint) а в словах (string) - эта база данных может хранить в себе в несколько тысяч раз больше данных помещенных в одно огромную комплексную векторную числовую матрицу в 3 измерениях, но скорость обработки их оставляет желать лучшего (Миллион токенов (1 слово до 3х токенов занимает) в секунду). Увы, полностью позать способ хранения всей википедии в числе я не могу, так как хочу запотентовать его когда мне исполниться 18. Но вот коротко по формулам что мы делаем.

Формулы НЕПОЛНЫЕ. Не пытайтесь повторить их если вы не доцент кафедры информационной науки (Data Science).

Ну и естественно нам нужно выдавать данные обратно, тут используем классический метод LLM успешно спизж скопирован у chat gpt:

Как я заставил NeuroYDZ3 думать?

Способность "думать" у NeuroYDZ3 догоняет chat gpt-4 с его способностью к рассуждению, но NeuroYDZ3 очень сильно уступает во всем что не связано с информационной справкой. Увы и ах - код за вас она не напишет. Раздумия NeuroYDZ это:
⁍ Несколько итераций с разными весами - чтобы получить несколько датасетов для работы
⁍ Объединение всех датасетов в один
⁍ Мини-обучение для получения наиболее удачного ответа
⁍ Разделение ответа на логические составляющие
⁍ Объединение ответа (в 2) по филологическому, орфографическому смыслам
⁍ Объединение обоих ответов в один цельный.
Все эти действия выполняются на чистом энтузиазме самой нейросети, то есть проще говоря, это как безусловный рефлекс у человека. Она не тратит время на обработку запросов алгоритмами чтоб получить более развернутый ответ, все эти шаги происходят во время обработки запроса и генерации НА ХОДУ.

КАК ЖЕ ПОПРОБОВАТЬ NEUROYDZ3?

Инструкция для самых маленьких! Заходим в этого Telegram бота, заходим, пишем /start и можем переписываться. Но важно понимать, что время от времени хостинг может ломаться, а так же NeuroYDZ не будет доступно с 01:00 по МСК до 12:00 по МСК каждый день, так как в это время происходит авто-обновление всех проектов.

Восхождение: Фаталити по статистике


Статистика на момент 10 марта 2025 года

Проект который просто должен был стать сюжетным раскрытием моего персонажа, стал самым просматриваемым видео за всю историю моего канала, принес мне 8 новых подписчиков в дискорд и даже несколько подписчиков в телеграм канале! Огромная радость видеть как что-то впервые выстреливает. Лор начал зарождаться еще во времена когда я еще ходил в школу, вылился сначала в комикс "Библиоапокалипсис" (Ныне недоступен) и "Tesseract" (Доступен но плохо грузится - в моем дискорд* сервере). Вся вселенная моей сюжетки взаимосвязанна, но из-за огромного количество дополнений - тессеракт и библиоапокалипсис не являются полным каноном. Но! Запуск прошел не так хорошо, сервис который хостит моих телеграм ботов - дал сбой и после выхода видео примерно 48 часов бот не был доступен, либо выдавал ошибку 502 при каждом обращении (То есть сервер что держал бота просто не выдержал). Естественно сервис которым я пользуюсь одновременно держит большую чась backend части моих проектов. Когда же будет следущая серия? Как только - так сразу. Я уже говорил об этом в описании но так как люди все еще спрашивают:

(Цитата) Важно понимать, что я не стараюсь сделать ултра-графонистый экшн, и увы мой бюджет ограничен, по этому, одним из трех столбцов стилистики сериала стал стиль старых PS2 игр. А еще, я не уверен что смогу часто выпускать серии, так как работаю, учусь, а еще я практикант, и у меня огромное количество дел, но буду рад вашей поддержке!

А вы помните Worldskills..?


Давно я не участвовал во всяких хакафонах, олимпиадах и подобных им мероприятиях. Недавно сидя в реддите увидел рекламу и записался на Deep Origin Challange Hackathon + позвал еще одного человека. Если пройдем отбор - вас ждет много контента, ибо мероприятие огромное. Призы во втором туре доходят до 3k$ и если выйграем - считайте я сэкономлю себе пол года работы для поступления в университет

Вы, кстати заметили новый дизайн газетки?

* - организация которая в рот давала Российскому законодательству, которая за свободу слова и по этому запрещена в России и ближних регионах.