릴리즈 노트

1.4.0

🚀 RAG 시스템 대폭 단순화 및 자동 감지 기능

주요 신기능

Django 설정 기반 자동 백엔드 감지: PostgreSQL → pgvector, SQLite → sqlite-vec 자동 선택
단순화된 팩토리 API: get_vector_store() 자동 감지, create_sqlite_store(), create_postgres_store() 추가
새로운 간단한 CLI 명령어: pyhub.rag create, pyhub.rag search, pyhub.rag load
Zero Configuration: Django 프로젝트에서 추가 설정 없이 RAG 사용 가능

CLI 개선사항

기존 명령어에서 --backend 파라미터 옵셔널화
명령어 길이 평균 50% 단축
더 직관적인 사용법: pyhub.rag search "query" docs

Breaking Changes

⚠️ VectorStoreRegistry Deprecation: VectorStoreRegistry는 더 이상 사용되지 않으며 향후 버전에서 제거 예정 + pyhub.rag.registry 모듈의 모든 함수에 deprecation 경고 추가 + 기존 코드는 경고와 함께 계속 동작하지만 새로운 API로 마이그레이션 권장

마이그레이션

상세한 마이그레이션 가이드 (MIGRATION_GUIDE.md) 제공
기존 코드 호환성 유지로 점진적 마이그레이션 가능

개발자 경험 향상

Before: pyhub.rag create-collection docs --backend sqlite-vec
After: pyhub.rag create docs (자동 감지)

1.2.2

pyhub.mcp 앱을 통한 MCP API 지원

1.2.1

pyhub.web 앱에서 기본 User 모델 커스텀
커스텀 404, 500 템플릿 지원

1.2.0

pyhub.web, pyhub.ui 앱을 통한 웹 UI 지원
PGVectorDocument 모델에서 check 프레임워크를 통해 인덱스 미지정 확인
StatusMixin 추상화 모델 클래스 추가 : 문서 처리 상태를 관리
PDFFileField 모델 필드 추가
pyhub.rag : PGVectorField 마이그레이션 시에 api key가 포함되는 버그 해결
pyhub.web 명령에서 django/uvicorn 서버 모두에서 DEBUG=False 상황에서도 static/media 파일 서빙 지원
pyhub.web 명령 추가 : print-settings (Feat. django-extensions)
pyhub.web 명령 추가 : migrate, showmigrations, createsuperuser, createuser, sqlmigrate, shell
*_DATABASE_URL 패턴의 환경변수를 파싱하여, settings.DATABASES 에 자동 등록
sqlite vec0, postgres pgvector 확장 설치 여부를 check 프레임워크를 통해 자동 확인
새 버전이 있을 때, 표준출력으로 알림
pyhub.llm ask 명령에서 중복된 -m 옵션 제거 (버그)

1.1.4

단일 Element를 Document로 변환할 때, elements 속성이 누락되는 버그 해결

1.1.3

pyhub.llm ask 명령에 --multi 멀티턴 옵션 추가
pyhub.llm embed 명령에 --verbose 시에만 설정 내역 출력

1.1.2

이미지 설명 작성 명령 추가 : pyhub.llm describe 이미지파일경로

1.1.1

파이썬 3.12 미만에서 중첩된 f-string을 지원하지 않는 버그 해결

1.1.0

~/.pyhub.toml을 통한 환경변수 설정 및 이미지/테이블 설명 작성 프롬프트 커스텀 지원
pyhub toml -c 명령으로 ~/.pyhub.toml 파일 생성 지원

1.0.7

--pages 옵션 지원 : 지정 페이지 번호만 변환 지원 (예: --pages 1,3,5)
시작페이지 번호 +1 버그 해결
cli 도움말 로직 개선

1.0.6

metadata['page']에 전체 페이지 주소를 반영

1.0.5

pyhub.parser upstage 명령 : metadata["source"] 항목에 PDF 파일명 추가

1.0.4

openai, google, ollama embed api에 대한 캐싱 지원

1.0.3

이미지 파일명 패턴 변경
- 기존 : category/id.jpg
- 변경 : p페이지번호/id-category.jpg

1.0.2

--batch-page-size 옵션(-b)을 다시 살려서, PDF 파일을 지정 단위로 끊어서 업스테이지 Document Parse API를 호출합니다.

1.0.1

API 벤더 (upstage, openai, anthropic, google, ollama) 별로 캐시 스토리지를 분리하여, 최대 개수를 API 별로 관리합니다. 캐싱된 개수가 5,000개가 되면 1/5이 제거됩니다.
pyhub.parser upstage --cache-clear-all 옵션으로 모든 캐시를 초기화합니다.