안녕하세요, AI 오픈소스 프로젝트에 관심을 갖고 계신 여러분!
이번 주에도 여러 흥미로운 오픈소스 프로젝트들이 새롭게 릴리즈되었습니다.
여러분께 도움이 될 만한 주요 릴리즈 소식을 정리해 보았으니, 관심 있는 프로젝트가 있다면 업데이트된 기능과 버그 수정 내용을 확인해 보세요.
제가 평소에 관심있게 살펴보는 프로젝트들입니다.
아래 목록에 추가하고 싶은 오픈소스 프로젝트가 있다면, 댓글로 남겨주세요!
- langchain-ai/langchain
- langchain-ai/langgraph
- huggingface/transformers
- vllm-project/vllm
- NVIDIA/TensorRT-LLM
- microsoft/DeepSpeed
- ollama/ollama
langchain-ai/langchain
langchain-core==0.2.38
https://github.com/langchain-ai/langchain/releases/tag/langchain-core%3D%3D0.2.38
이번 langchain-core==0.2.38
릴리즈에서는 다음과 같은 주요 변경 사항이 포함되었습니다:
- 여러 환경 변수 키 지원: 비밀 정보(Secrets)를 환경 변수에서 불러오는 기능에 대해 여러 환경 변수 키를 지원하도록 개선되었습니다. (#25971)
- 문서 수정: 문서의 글머리 기호 목록의 간격을 수정하여 가독성을 높였습니다. (#25950)
- StructuredPrompt 개선:
StructuredPrompt
에서 추가적인 키워드 인수를 지원하도록 업데이트되었습니다. (#25645) - 글로벌 변수 포함:
get_function_nonlocals
메소드에서 찾을 수 있는 변수에 글로벌 변수를 포함하도록 변경되었습니다. (#25936) - 불리언 변환 문제 처리: 불리언으로 변환할 수 없는 직렬화 가능한 필드를 처리하는 기능이 추가되었습니다. (#25903)
- GraphVectorStore API 문서 추가: 커뮤니티 패치와 문서 개선을 통해
GraphVectorStore
에 대한 API 참조 문서가 추가되었습니다. (#25751)
이 업데이트는 주로 기능 개선과 버그 수정에 초점을 맞추고 있어, 사용자가 더 나은 경험을 할 수 있도록 돕고 있습니다.
langchain==0.2.16
https://github.com/langchain-ai/langchain/releases/tag/langchain%3D%3D0.2.16
langchain==0.2.16 릴리즈는 몇 가지 주요 변경 사항을 포함하고 있습니다.
- 문서 업데이트:
integrations
섹션에 대한 참조가 업데이트되었습니다. 이는 사용자들이 다양한 통합 기능을 보다 쉽게 이해하고 활용할 수 있도록 돕기 위한 것입니다. - Self-Query Retriever 수정: Qdrant 관련 부분에서 Self-Query Retriever 팩토리의 클래스 체크가 업데이트되었습니다. 이는 데이터 검색의 정확성을 향상시키기 위한 수정입니다.
- Neo4j 쿼리 생성기 추가: Self Query를 위한 Neo4j 쿼리 생성기가 추가되었습니다. 이를 통해 Neo4j 데이터베이스와의 상호작용이 더욱 용이해졌습니다.
- 인프라 개선: langchain 테스트의 불필요한 부분이 제거되었습니다. 이는 전체적인 테스트 환경을 개선하고 유지 관리를 용이하게 합니다.
- OpenAIFunctionsAgent 개선: OpenAIFunctionsAgent에 "strict" 파라미터가 추가되었습니다. 이는 사용자에게 더 세밀한 제어를 제공하여 기능 사용 시 유연성을 높입니다.
- Moderation Chain 수정: Moderation 체인의 초기화 과정에서 발생한 문제를 수정하여 안정성을 개선했습니다.
이러한 변경 사항들은 전체적인 성능과 사용자 경험을 향상시키기 위한 노력의 일환으로, 개발자와 사용자 모두에게 긍정적인 영향을 미칠 것으로 기대됩니다.
langchain-ai/langgraph
0.2.17
https://github.com/langchain-ai/langgraph/releases/tag/0.2.17
이번 0.2.17 버전의 릴리즈 노트에는 여러 가지 주요 변경 사항이 포함되어 있습니다. 주요 내용은 다음과 같습니다:
- Mermaid 스냅샷 업데이트: 이전 버전의 Mermaid 스냅샷을 업데이트했습니다.
- Pydantic v2 및 langchain-core 호환성: Pydantic v2 및 langchain-core 0.3과의 호환성을 위해 여러 가지 변경이 이루어졌습니다.
- 레거시 ID 제거: 더 이상 사용되지 않는 레거시 ID를 제거했습니다.
- 작업 준비 함수 분리:
prepare_single_task
와prepare_next_tasks
를 분리하여 작업 준비 과정을 개선했습니다. - 메타데이터 개선: 인터럽트 메타데이터에 이전 및 이후 값을 추가하여 더 많은 정보를 제공하도록 개선했습니다.
- 성능 개선:
local_read
및 출력 전송 속도를 개선하고, 벤치마크 그래프의 처리 시간을 9초에서 4초로 단축했습니다. - 비동기 처리 개선: 비동기 체크포인터의 동기 메서드를 구현하고, 테스트에서 비동기 체크포인터가 사용되는 이벤트 루프 내에서 설정되도록 보장했습니다.
- 테스트 및 버그 수정: 여러 테스트를 추가하고, 기존 테스트에서 발생한 문제를 수정했습니다.
- SQLite 체크포인터 작업에 대한 잠금 사용: SQLite 체크포인터와 관련된 모든 작업에 대해 잠금을 사용하여 동시성 문제를 해결했습니다.
- 대규모 병렬 그래프 테스트 추가: 대규모 병렬 그래프에 대한 테스트를 추가하여 성능을 검증했습니다.
이 외에도 여러 가지 코드 리팩토링 및 성능 개선이 이루어졌습니다. 전반적으로 이번 릴리즈는 호환성을 높이고 성능을 개선하는 데 중점을 두었습니다.
0.2.18
https://github.com/langchain-ai/langgraph/releases/tag/0.2.18
0.2.18 릴리즈에서는 다음과 같은 변경 사항이 있습니다:
- 복사 기능의 수정: 기존의 복사 기능에 대한 문제가 해결되었습니다.
- langgraph 0.2.18 버전으로 업데이트되었습니다.
- Pregel.copy() 메서드가 다시 추가되었습니다.
이번 릴리즈는 주로 버그 수정과 기능 복원이 이루어졌습니다.
0.2.19
https://github.com/langchain-ai/langgraph/releases/tag/0.2.19
이번 langgraph 0.2.19 릴리즈에서는 다음과 같은 변경사항이 포함되었습니다:
- 디버그 작업 이벤트 타이밍 수정: 디버그 작업의 이벤트 타이밍이 수정되어, 보다 정확한 디버깅 지원이 가능해졌습니다.
- ToolNode에서 Pydantic 및 데이터 클래스 지원: ToolNode에서 Pydantic 및 데이터 클래스를 지원하게 되어, 데이터 검증 및 구조화를 보다 쉽게 할 수 있게 되었습니다. (#1625)
이번 업데이트는 주로 디버깅 기능과 데이터 처리의 유연성을 개선하는 데 중점을 두었습니다.
vllm-project/vllm
v0.6.0
https://github.com/vllm-project/vllm/releases/tag/v0.6.0
vLLM 프로젝트의 v0.6.0 릴리즈 노트에 따르면, 이번 업데이트는 여러 주요 개선 사항과 새로운 기능을 포함하고 있습니다. 아래는 주요 내용입니다.
성능 향상
- v0.5.3 대비 2배 더 빠른 처리량을 제공하는 업데이트가 이루어졌습니다. 기본 설정으로도 속도 향상이 가능하지만,
--num-scheduler-steps 8
옵션을 활성화하여 멀티 스텝 스케줄링을 시도해볼 것을 권장합니다. - 비동기 출력 프로세서가 GPU 작업과 데이터 구조 생성을 겹치게 하여 12%의 처리량 증가를 달성했습니다.
- FlashInfer 백엔드를 사용하여 FP8 KV 캐시를 최적화하고, Speculative Decoding에서의 재채택 샘플링을 지원합니다.모델 지원
- 8비트 및 FP4 양자화 모델을 지원합니다.
- 새로운 LLM 모델로 Exaone, Granite, Phi-3.5-MoE가 추가되었습니다.
- 미스트랄 모델을 위한 새로운 토크나이저 모드가 도입되었습니다.
- 멀티모달 지원이 강화되어 여러 이미지 입력을 처리할 수 있게 되었습니다.하드웨어 지원
- NVIDIA GPU에 대한 CUDA 그래프 크기를 확장하고, AMD 및 Intel GPU에 대한 다양한 지원이 추가되었습니다.
- TPU 및 Neuron에 대한 지원도 개선되었습니다.프로덕션 기능
- OpenAI와 호환되는 도구 API와 스트리밍 기능이 Hermes 및 Mistral 모델에 추가되었습니다.
- 멀티모달 지원이 오프라인 채팅 및 OpenAI 프론트엔드에서 여러 항목을 처리할 수 있도록 개선되었습니다.기타 개선 사항
- 비동기 엔진의 성능을 벤치마킹할 수 있는 기능이 추가되었습니다.
torch.compile
통합에 대한 진행 사항도 포함되어 있습니다.
이번 업데이트는 성능과 기능 모두에서 큰 개선을 이루어내어 사용자에게 더 나은 경험을 제공할 것으로 기대됩니다. 전체 변경 내역은 여기에서 확인할 수 있습니다.
microsoft/DeepSpeed
v0.15.1
https://github.com/microsoft/DeepSpeed/releases/tag/v0.15.1
DeepSpeed의 v0.15.1 릴리즈에서는 여러 가지 개선 사항과 수정이 포함되었습니다. 주요 변경 사항은 다음과 같습니다:
- 버전 관리: v0.15.0 릴리즈 이후 version.txt 파일이 업데이트되었습니다.
- 타입 불일치 수정: 타입 불일치를 수정하여 안정성을 높였습니다.
- 중복 인자 제거: Z3/MiCS에서 불필요한 seq data parallel 그룹 인자를 제거했습니다.
- 하드웨어 설정 가이드 추가: Huawei Ascend NPU에 대한 설정 가이드가 추가되었습니다.
- SSH 없는 로컬 실행 문서화: SSH 없이 로컬에서 실행하는 방법에 대한 문서가 추가되었습니다.
- 데이터 타입 지원 확인: 가속기에 대한 데이터 타입 지원 체크가 추가되었습니다.
- CIFAR 데이터 저장/불러오기: CIFAR 데이터를 로컬에서 저장하고 불러오는 기능이 추가되었습니다.
- 시작 가이드에 링크 추가: Getting Started 페이지에 가속기 설정 가이드 링크가 추가되었습니다.
- Triton 버전 호환성: fp_quantizer에서 triton==3.0.x를 허용하게 되었습니다.
- GDS 스레드 변경: GDS를 1개의 AIO 스레드로 변경했습니다.
- ROCm에서 빌드 오류 방지: ROCm에서 GDS 빌드 오류를 방지하는 수정이 포함되었습니다.
- 메모리 사용량 테스트: 낮은 CPU 메모리 사용량을 테스트하는 유닛 테스트가 추가되었습니다.
- DeepNVMe 튜토리얼: DeepNVMe 사용을 위한 튜토리얼이 추가되었습니다.
- 다양한 수정사항: bf16_optimizer의 다양한 수정사항이 포함되었으며, CUDA_HOME이 ROCm 시스템에서 정의되지 않은 경우를 처리하는 기능이 추가되었습니다.
이번 릴리즈에서는 새로운 기여자들도 여러 명 추가되었습니다. 전체 변경 사항은 GitHub의 변경 로그에서 확인할 수 있습니다.
ollama/ollama
v0.3.10
https://github.com/ollama/ollama/releases/tag/v0.3.10
이번 Munch 프로젝트의 v0.3.10 릴리즈는 여러 가지 새로운 모델과 버그 수정, 그리고 새로운 기여자가 포함되어 있습니다. 주요 내용은 다음과 같습니다:
새로운 모델
- Reflection: 새로운 기법인 Reflection-tuning으로 훈련된 고성능 모델로, LLM이 자신의 추론에서 실수를 감지하고 수정하는 방법을 학습합니다.
- Yi-Coder: 10억 개의 매개변수 미만으로 최고 수준의 코딩 성능을 제공하는 오픈 소스 코드 언어 모델 시리즈입니다.
- DeepSeek-V2.5: DeepSeek-V2의 업그레이드 버전으로, DeepSeek-V2-Chat과 DeepSeek-Coder-V2-Instruct의 일반 및 코딩 능력을 통합했습니다.변경 사항
ollama show
실행 시 특정 모델에서 발생할 수 있는 드문 오류를 수정했습니다.- CUDA 11을 사용하여 CUDA 12와 호환되지 않는 구형 NVIDIA 드라이버에 대한 지원이 추가되었습니다.
ollama create
명령어를 실행할 때 Gemma 2 모델을 safetensors에서 가져오는 오류가 수정되었습니다.새로운 기여자이번 릴리즈에는 여러 새로운 기여자가 포함되어 있으며, 각자의 첫 기여를 통해 프로젝트에 참여했습니다. 이들은 GitHub에서 다양한 풀 리퀘스트를 제출했습니다.
이 릴리즈는 모델 성능 개선과 안정성 향상에 중점을 두고 있으며, 사용자들에게 더 나은 경험을 제공하기 위해 여러 가지 수정이 이루어졌습니다.
이번 주에도 다양한 오픈소스 프로젝트들이 활발히 발전하고 있음을 알 수 있습니다.
여러분이 관심을 갖고 있는 프로젝트들도 이번 릴리즈에서 개선된 부분이 있는지 꼭 확인해 보시길 바랍니다.
오픈소스 커뮤니티의 발전에 기여하는 개발자들에게 감사의 마음을 전하며, 앞으로도 더 많은 흥미로운 소식을 전해드리겠습니다.
읽어주셔서 감사합니다! 다음 주에도 유용한 정보로 찾아뵙겠습니다.
'AI > 오픈소스 릴리즈 노트' 카테고리의 다른 글
오픈소스 릴리즈 노트 읽기 - 24년 9월 2, 3주차 (0) | 2024.09.20 |
---|---|
오픈소스 릴리즈 노트 읽기 - 8월 5주차 (1) | 2024.09.02 |
오픈소스 릴리즈 노트 읽기 - 8월 4주차 (1) | 2024.08.26 |
오픈소스 릴리즈 노트 읽기 - 8월 3주차 (0) | 2024.08.20 |
오픈소스 릴리즈 노트 읽기 - 8월 2주차 (0) | 2024.08.10 |