PostgresML - это расширение для сервера баз данных PostgreSQL, которое позволяет выполнять машинное обучение от начала и до конца внутри вашей базы данных. Оно позволяет пользователям создавать, обучать и развертывать модели машинного обучения непосредственно в PostgreSQL, устраняя необходимость в перемещении данных между системами. С помощью SQL-запросов пользователи могут выполнять обучение и вывод как по текстовым, так и по табличным данным, максимизируя конфиденциальность и безопасность данных, одновременно снижая задержку и улучшая производительность.
Основные функции PostgresML
Машинное обучение в базе данных
Обучение моделей на основе SQL
Вывод по текстовым и табличным данным
Интегрированная безопасность данных
Не требует перемещения данных
Плюсы и минусы PostgresML
Минусы
В настоящее время не поддерживает прямую интеграцию с некоторыми удалёнными поставщиками LLM, такими как OpenAI
Самостоятельный хостинг может потребовать знаний Docker и PostgreSQL
В первую очередь рассчитан на пользователей, знакомых с PostgreSQL и SQL
Плюсы
ML и AI операции в базе данных устраняют необходимость перемещения данных
Поддержка ускорения GPU для более быстрых вычислений
Интеграция с передовыми крупными языковыми моделями через Hugging Face
Встроенный конвейер для генерации с поисковым усилением (RAG)
Высокая масштабируемость и поддержка миллионов транзакций в секунду
Широкий спектр поддерживаемых алгоритмов ML и задач NLP