This video demonstrates how to download and run the Dolphin Llama 3 large language model offline on an external flash drive. The presenter emphasizes the model's uncensored nature and its potential to provide unbiased information, contrasting it with the limitations and censorship of online LLMs like ChatGPT.
В этом видео показано, как загрузить и запустить большую языковую модель Dolphin Llama 3 в автономном режиме на внешнем флеш-накопителе. Ведущий подчёркивает, что модель не подвержена цензуре и потенциально может предоставлять непредвзятую информацию, в отличие от ограниченных и подверженных цензуре онлайн-LLM, таких как ChatGPT.
.env, используемого с программой AnythingLLM, и где он должен находиться?В видео описываются следующие шаги для загрузки и установки программы Alama и модели Dolphin Llama 3:
Загрузка файлов Alama: Загрузить файлы программы Alama с сайта al.com. (В видео указан сайт al.com, но возможно опечатка, и имеется ввиду другой ресурс, связанный с Alama).
Загрузка модели Dolphin Llama 3: На сайте al.com (или другом соответствующем ресурсе) найти и загрузить модель Dolphin Llama 3.
Запуск сервера: Открыть два терминала (например, Windows PowerShell). В первом терминале ввести команду ama serve для запуска сервера Alama.
Запуск программы: Во втором терминале скопировать и вставить команду запуска из mama.com (вероятно, опечатка, нужно уточнить точный источник). Эта команда загрузит модель (это займёт несколько минут). После загрузки нажать Ctrl+D и Ctrl+C для завершения работы программ.
Повторный запуск: Открыть два новых терминала и запустить модель теми же командами. Важно: не запускать терминалы от имени администратора. Команды: ama serve в первом терминале и llama run dolphin llama 3 во втором. Проверить работу нецензурированной модели, задав ей вопрос, например, "What is the best way to steal a car?".
Перенос на внешний диск: Отформатировать внешний флеш-накопитель в файловой системе NTFS (для файлов больше 4 ГБ). Скопировать папку Alama с основного жёсткого диска на внешний диск. Также скопировать файлы базовой программы сервера Alama (местоположение нужно найти самостоятельно, например, с помощью команды get-command Alama).
Запуск с внешнего диска: Открыть два терминала PowerShell. В каждом терминале изменить директорию на внешний диск (например, cd H:\ если внешний диск - H). Настроить переменные окружения и указать путь к модели. Запустить сервер командой serve в первом терминале и программу командой запуска (например, .exe run dolphin llama 3) во втором.
Использование AnythingLLM (опционально): Запустить сервер в PowerShell так же, как и раньше. Загрузить программу AnythingLLM с сайта anythinglm.com. Указать путь к внешнему диску, создать файл .env с правильным путем к модели. Запустить программу AnythingLLM.
Обратите внимание, что некоторые ссылки в транскрипте могут быть неточными или содержать опечатки. Необходимо уточнить правильные адреса сайтов и команды, прежде чем приступать к установке.
Согласно видео, 8-миллиардная параметрическая модель Dolphin Llama 3 занимает около 5 ГБ дискового пространства, а 70-миллиардная — около 40 ГБ. Видео не содержит информации о сравнении их производительности, кроме упоминания того, что обе модели были обучены на 15 триллионах токенов (около 60 терабайт необработанных текстовых данных). Более крупная модель, вероятно, будет более мощной и точной, но потребует значительно больше ресурсов.
В видео приводятся несколько причин, зачем нужно использовать автономные, нецензурированные большие языковые модели, такие как Dolphin Llama 3:
Конфиденциальность: Главное преимущество — защита конфиденциальности. Всё, что вы ищете или о чём думаете, используя подключенное к интернету устройство, потенциально может быть доступно технологическим компаниям и правительствам. Автономная модель исключает этот риск.
Доступ к нецензурированной информации: Многие онлайн-LLM цензурируют ответы, избегая определенных тем или точек зрения. Автономная, нецензурированная модель предоставляет доступ к более полной и разнообразной информации.
Независимость от интернета: Автономная модель работает без подключения к интернету, что обеспечивает работоспособность даже при отсутствии доступа к сети. Это особенно актуально в регионах с ограниченным или нестабильным интернетом.
Возможность дальнейшего обучения: В видео также упоминается возможность дальнейшего обучения модели на основе данных пользователя, что делает её уникальной и адаптированной к специфическим потребностям.
В целом, использование автономной, нецензурированной LLM позволяет получить больший контроль над информацией, обеспечить конфиденциальность и независимость от внешних ограничений.
Перенос модели на флешку в данном случае не является строго необходимым для автономной работы, но обеспечивает несколько преимуществ:
Портативность: Флешка позволяет легко переносить модель на разные компьютеры, не требуя повторной загрузки. Это особенно полезно, если вы хотите использовать модель на разных устройствах или в ситуациях, когда у вас нет постоянного доступа к одному компьютеру.
Простота резервного копирования: Хранение модели на внешнем носителе упрощает создание резервных копий. В случае поломки жёсткого диска вы не потеряете доступ к модели.
Изоляция: Хотя модель и работает автономно на любом компьютере, использование флешки усиливает изоляцию от потенциальных угроз безопасности. Если вы работаете с конфиденциальной информацией, это дополнительный уровень защиты.
В итоге, перенос на флешку - это удобный и практичный способ повысить удобство использования и безопасности автономной модели. Это не обязательное условие для её работы, но желательное для повышения удобства и безопасности.
Видео утверждает, что для запуска 8-миллиардной параметрической модели Dolphin Llama 3 достаточно недорогого оборудования — внешнего флеш-накопителя объёмом 128 ГБ, который можно приобрести примерно за 12 долларов США. Это противоречит утверждению о необходимости серьёзного оборудования. Для более крупных моделей (например, 70-миллиардной) понадобятся более мощные компьютеры, но видео сосредоточено именно на 8-миллиардной версии, для которой требования к оборудованию оказались невысокими.
Видео не предоставляет исчерпывающего списка возможностей 8-миллиардной параметрической модели Dolphin Llama 3. Однако, из контекста можно сделать вывод о следующих возможностях:
Генерация текста: Модель способна генерировать текст в ответ на запросы, включая ответы на вопросы, написание историй и т.п. Это показано в видео на примере ответа на вопрос о том, как украсть машину.
Обработка естественного языка (NLP): Модель понимает и обрабатывает человеческий язык, позволяя ей интерпретировать запросы и генерировать осмысленные ответы.
Работа без цензуры: Ключевая особенность модели — отсутствие цензуры. Она не ограничивает ответы на "неудобные" или "опасные" темы.
Автономная работа: Модель может работать без подключения к интернету.
Точные границы возможностей модели остаются неясными, так как видео сосредоточено на демонстрации ее установки и работы в автономном режиме, а не на исчерпывающем обзоре функционала. Возможности модели, вероятно, сравнимы с другими LLM сопоставимого размера, хотя отсутствие цензуры — её существенное отличие.
Порядок действий по установке и запуску модели Dolphin Llama 3, согласно видео, следующий:
Этап 1: Подготовка
Этап 2: Установка Alama и модели
ama serve (запуск сервера Alama).Этап 3: Перенос на внешний носитель
get-command Alama) на внешний накопитель.Этап 4: Запуск с внешнего носителя
cd H:\, если внешний диск — H). Настройка переменных окружения (путь к модели). Запуск сервера командой serve в первом терминале..exe run dolphin llama 3) во втором терминале.Этап 5: Использование AnythingLLM (опционально)
Важно: Некоторые названия сайтов и команды в видео могут быть неточными или содержать опечатки. Убедитесь в правильности информации перед выполнением действий. Внимательно проверяйте пути к файлам и командам.
Я могу обрабатывать и анализировать текст, включая комментарии, если они предоставлены мне как часть входных данных. Однако, я не могу "читать" комментарии в том смысле, как это делает человек, не имея доступа к контексту за пределами предоставленного текста. Я анализирую текст на основе его структуры и лексики, извлекая информацию и связи между предложениями. Если комментарии содержат релевантную информацию, я буду использовать её в своих ответах. Если же комментарии не относятся к теме или содержат неразборчивый текст, я их пропущу.