릴리즈 노트
1.4.0
🚀 RAG 시스템 대폭 단순화 및 자동 감지 기능
주요 신기능
- Django 설정 기반 자동 백엔드 감지: PostgreSQL → pgvector, SQLite → sqlite-vec 자동 선택
- 단순화된 팩토리 API:
get_vector_store()자동 감지,create_sqlite_store(),create_postgres_store()추가 - 새로운 간단한 CLI 명령어:
pyhub.rag create,pyhub.rag search,pyhub.rag load - Zero Configuration: Django 프로젝트에서 추가 설정 없이 RAG 사용 가능
CLI 개선사항
- 기존 명령어에서
--backend파라미터 옵셔널화 - 명령어 길이 평균 50% 단축
- 더 직관적인 사용법:
pyhub.rag search "query" docs
Breaking Changes
⚠️ VectorStoreRegistry Deprecation: VectorStoreRegistry는 더 이상 사용되지 않으며 향후 버전에서 제거 예정
+ pyhub.rag.registry 모듈의 모든 함수에 deprecation 경고 추가
+ 기존 코드는 경고와 함께 계속 동작하지만 새로운 API로 마이그레이션 권장
마이그레이션
- 상세한 마이그레이션 가이드 (
MIGRATION_GUIDE.md) 제공 - 기존 코드 호환성 유지로 점진적 마이그레이션 가능
개발자 경험 향상
- Before:
pyhub.rag create-collection docs --backend sqlite-vec - After:
pyhub.rag create docs(자동 감지)
1.2.2
pyhub.mcp앱을 통한 MCP API 지원
1.2.1
pyhub.web앱에서 기본 User 모델 커스텀- 커스텀
404,500템플릿 지원
1.2.0
pyhub.web,pyhub.ui앱을 통한 웹 UI 지원PGVectorDocument모델에서 check 프레임워크를 통해 인덱스 미지정 확인StatusMixin추상화 모델 클래스 추가 : 문서 처리 상태를 관리PDFFileField모델 필드 추가pyhub.rag: PGVectorField 마이그레이션 시에 api key가 포함되는 버그 해결pyhub.web명령에서 django/uvicorn 서버 모두에서DEBUG=False상황에서도 static/media 파일 서빙 지원pyhub.web명령 추가 :print-settings(Feat.django-extensions)pyhub.web명령 추가 : migrate, showmigrations, createsuperuser, createuser, sqlmigrate, shell*_DATABASE_URL패턴의 환경변수를 파싱하여,settings.DATABASES에 자동 등록- sqlite vec0, postgres pgvector 확장 설치 여부를 check 프레임워크를 통해 자동 확인
- 새 버전이 있을 때, 표준출력으로 알림
pyhub.llm ask명령에서 중복된-m옵션 제거 (버그)
1.1.4
- 단일 Element를 Document로 변환할 때, elements 속성이 누락되는 버그 해결
1.1.3
pyhub.llm ask명령에--multi멀티턴 옵션 추가pyhub.llm embed명령에--verbose시에만 설정 내역 출력
1.1.2
- 이미지 설명 작성 명령 추가 :
pyhub.llm describe 이미지파일경로
1.1.1
- 파이썬 3.12 미만에서 중첩된 f-string을 지원하지 않는 버그 해결
1.1.0
~/.pyhub.toml을 통한 환경변수 설정 및 이미지/테이블 설명 작성 프롬프트 커스텀 지원pyhub toml -c명령으로~/.pyhub.toml파일 생성 지원
1.0.7
--pages옵션 지원 : 지정 페이지 번호만 변환 지원 (예:--pages 1,3,5)- 시작페이지 번호
+1버그 해결 - cli 도움말 로직 개선
1.0.6
metadata['page']에 전체 페이지 주소를 반영
1.0.5
pyhub.parser upstage명령 :metadata["source"]항목에 PDF 파일명 추가
1.0.4
openai,google,ollamaembed api에 대한 캐싱 지원
1.0.3
- 이미지 파일명 패턴 변경
- 기존 :
category/id.jpg - 변경 :
p페이지번호/id-category.jpg
- 기존 :
1.0.2
--batch-page-size옵션(-b)을 다시 살려서, PDF 파일을 지정 단위로 끊어서 업스테이지 Document Parse API를 호출합니다.
1.0.1
- API 벤더 (upstage, openai, anthropic, google, ollama) 별로 캐시 스토리지를 분리하여, 최대 개수를 API 별로 관리합니다. 캐싱된 개수가 5,000개가 되면 1/5이 제거됩니다.
pyhub.parser upstage --cache-clear-all옵션으로 모든 캐시를 초기화합니다.
