AI Stack с Ollama и веб-интерфейсом

Полнофункциональный стек искусственного интеллекта с локальными LLM моделями и современным веб-интерфейсом.

🚀 Возможности

Локальные LLM модели через Ollama
Веб-интерфейс Open WebUI (аналог ChatGPT UI)
Голосовой ввод/вывод (STT/TTS) средствами WebUI (доступно при HTTPS-подключении)
Автоматическая загрузка моделей из конфигурационного файла
HTTP/HTTPS поддержка через Nginx (самоподписанные сертификаты для HTTPS)

📐 Архитектура

flowchart TD

    classDef invisibleLine stroke:none,stroke-width:0
    %% classDef invisible fill:none,stroke:none,width:0,height:0

    User["👤 Пользователь"]

    subgraph "Интерфейсы"
        Browser["🌐 Веб-браузер"]
        APIClients["🔧 API Клиенты<br/>Локальные сервисы"]
    end

    Nginx["🛡️ Nginx<br/>HTTP/HTTPS прокси"]
    WebUI["💻 Open WebUI"]
    Ollama["🤖 Ollama<br/>LLM сервер"]

    Models["📦 Загруженные модели"]
    Config["⚙️ Конфигурация<br/>__models.txt__"]

    %% Невидимые узлы для разделения стрелок:
    %% subgraph " "
    %%     p1[" "]:::invisible
    %%     p2[" "]:::invisible
    %%     p3[" "]:::invisible
    %% end

    %% Пользовательские связи:
    User --> Browser
    User --> APIClients

    %% Сетевые связи:
    Browser    -- :80/443 --> Nginx
    Browser    -- :8080   --> WebUI
    APIClients -- :11434  --> Ollama
    
    %% Добавляем цвета к портам:
    linkStyle 2 stroke:blue,stroke-width:1px;
    linkStyle 3 stroke:green,stroke-width:1px;
    linkStyle 4 stroke:orange,stroke-width:1px;

    %% Взаимодействие через веб-интерфейс:
    Nginx --> WebUI

    %% Взаимодействие WebUI с Ollama:
    WebUI --> Ollama

    %% Данные и конфигурация:
    Ollama --> Config
    Ollama --> Models

⚡ Быстрый старт

Предварительные требования

Docker и Docker Compose
Минимум 8 ГБ ОЗУ (рекомендуется 16+ ГБ)
20 ГБ свободного места на диске для моделей
Доступ в интернет для загрузки моделей
NVIDIA GPU (рекомендуется для лучшей производительности)

Установка и запуск

Клонируйте репозиторий

git clone https://github.com/NikitaShubin/SelfHostedAI.git
cd SelfHostedAI

Настройте модели (опционально) Отредактируйте файл models.txt, раскомментировав или дописав нужные модели:
```
nano models.txt
```
Запустите стек:
```
./run.sh
```
Дождитесь загрузки моделей (может занять время в зависимости от выбранных моделей и скорости интернета)
Откройте в браузере:
- Веб-интерфейс (HTTP): http://localhost
- Веб-интерфейс (HTTPS): https://localhost
- Прямой доступ к WebUI: http://localhost:8080
- Ollama API: http://localhost:11434

Примечание: Некоторые браузеры могут автоматически переключать HTTP на HTTPS.

🎯 Использование

Веб-интерфейс (Open WebUI)

Откройте в браузере:
- http://localhost (HTTP, без предупреждений)
- https://localhost для поддержки голосового общения (HTTPS, с предупреждением о самоподписанном сертификате)
При использовании HTTPS примите самоподписанный сертификат
Зарегистрируйте нового пользователя или войдите
Выберите модель из списка загруженных
Начните общение с ИИ (через HTTPS доступно использование голосвого ввода/вывода)

API Ollama

Прямой доступ к Ollama API доступен по адресу:

# Список моделей
curl http://localhost:11434/api/tags

# Генерация текста
curl http://localhost:11434/api/generate -d '{
  "model": "qwen2.5-coder:7b-instruct",
  "prompt": "Привет, как дела?",
  "stream": false
}'

📁 Структура проекта

.
├── nginx/                # Nginx прокси с SSL
│   ├── Dockerfile        # Образ Nginx с генерацией сертификатов
│   ├── generate-ssl.sh   # Скрипт генерации SSL сертификатов
│   └── nginx.conf        # Конфигурация Nginx
├── ollama/               # Ollama сервер
│   ├── Dockerfile        # Образ Ollama с утилитами
│   └── init-models.sh    # Скрипт загрузки моделей
├── docker-compose.yaml   # Конфигурация Docker Compose
├── models.txt            # Список моделей для загрузки
├── monitor.sh            # Мониторинг сервисов
├── restart.sh            # Перезапуск стека
├── run.sh                # Основной скрипт запуска
└── stop.sh               # Остановка стека

⚙️ Конфигурация и мониторинг

Переменные окружения

В docker-compose.yaml можно настроить:

OLLAMA_KEEP_ALIVE: Время хранения моделей в памяти
OLLAMA_HOST: Адрес сервера Ollama
HF_HUB_OFFLINE: Режим работы с HuggingFace

Портs

80: HTTP (веб-интерфейс без шифрования)
443: HTTPS (веб-интерфейс с шифрованием)
8080: Прямой доступ к Open WebUI
11434: Ollama API

Настройка моделей

Для внесения новых моделей в систему добавьте их названия в список models.txt и выполните перезапуск:

./restart.sh

Удаление или комментирование строк в списке не приведёт к удалению уже установленных модели из системы.

Размеры моделей:

7B модели: ~4-5 ГБ, работают на CPU (медленно) или GPU
8B модели: ~5-6 ГБ, хороший баланс качества/скорости
20B+ модели: 10+ ГБ, требуют много памяти и GPU

Мониторинг

# Статус всех сервисов
./monitor.sh

# Логи конкретного сервиса
docker compose logs ollama -f
docker compose logs webui -f

🔒 Безопасность и продакшн

Самоподписанные сертификаты

Стек использует самоподписанные SSL сертификаты для разработки. В браузере появится предупреждение - это нормально.

Вывод в продакшен

Замените сертификаты в ./data/nginx/ на полученные от Let's Encrypt
Обновите nginx.conf для использования реальных доменов
Настройте брандмауэр для доступа только к необходимым портам

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AI Stack с Ollama и веб-интерфейсом

🚀 Возможности

📐 Архитектура

⚡ Быстрый старт

Предварительные требования

Установка и запуск

🎯 Использование

Веб-интерфейс (Open WebUI)

API Ollama

Переменные окружения

Портs

Настройка моделей

Мониторинг

Самоподписанные сертификаты

Вывод в продакшен

Рекомендации по безопасности

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
nginx		nginx
ollama		ollama
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
docker-compose.yaml		docker-compose.yaml
models.txt		models.txt
monitor.sh		monitor.sh
restart.sh		restart.sh
run.sh		run.sh
stop.sh		stop.sh

Folders and files

Latest commit

History

Repository files navigation

AI Stack с Ollama и веб-интерфейсом

🚀 Возможности

📐 Архитектура

⚡ Быстрый старт

Предварительные требования

Установка и запуск

🎯 Использование

Веб-интерфейс (Open WebUI)

API Ollama

Переменные окружения

Портs

Настройка моделей

Мониторинг

Самоподписанные сертификаты

Вывод в продакшен

Рекомендации по безопасности

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages