G-EVAL: NLG Evaluation using GPT-4 with Better Human Alignment
·
AI/기술,논문 리뷰
https://arxiv.org/abs/2303.16634 G-Eval: NLG Evaluation using GPT-4 with Better Human AlignmentThe quality of texts generated by natural language generation (NLG) systems is hard to measure automatically. Conventional reference-based metrics, such as BLEU and ROUGE, have been shown to have relatively low correlation with human judgments, especiallyarxiv.org  논문이 작성되게 된 배경자연어 생성(NLG) 시스템의 평가 어려움:..
오픈소스 릴리즈 노트 읽기 - 8월 4주차
·
AI/오픈소스 릴리즈 노트
안녕하세요, AI 오픈소스 프로젝트에 관심을 갖고 계신 여러분!이번 주에도 여러 흥미로운 오픈소스 프로젝트들이 새롭게 릴리즈되었습니다.여러분께 도움이 될 만한 주요 릴리즈 소식을 정리해 보았으니, 관심 있는 프로젝트가 있다면 업데이트된 기능과 버그 수정 내용을 확인해 보세요.  제가 평소에 관심있게 살펴보는 프로젝트들입니다.아래 목록에 추가하고 싶은 오픈소스 프로젝트가 있다면, 댓글로 남겨주세요!langchain-ai/langchainhuggingface/transformersvllm-project/vllmNVIDIA/TensorRT-LLMmicrosoft/DeepSpeedollama/ollama  langchain-ai/langchainlangchain-core==0.2.34https://github...
오픈소스 릴리즈 노트 읽기 - 8월 3주차
·
AI/오픈소스 릴리즈 노트
안녕하세요, AI 오픈소스 프로젝트에 관심을 갖고 계신 여러분!이번 주에도 여러 흥미로운 오픈소스 프로젝트들이 새롭게 릴리즈되었습니다.여러분께 도움이 될 만한 주요 릴리즈 소식을 정리해 보았으니, 관심 있는 프로젝트가 있다면 업데이트된 기능과 버그 수정 내용을 확인해 보세요.  제가 평소에 관심있게 살펴보는 프로젝트들입니다.아래 목록에 추가하고 싶은 오픈소스 프로젝트가 있다면, 댓글로 남겨주세요!langchain-ai/langchainhuggingface/transformersvllm-project/vllmNVIDIA/TensorRT-LLMmicrosoft/DeepSpeedollama/ollama  langchain-ai/langchainlangchain-core==0.2.31https://github...
오픈소스 릴리즈 노트 읽기 - 8월 2주차
·
AI/오픈소스 릴리즈 노트
안녕하세요, AI 오픈소스 프로젝트에 관심을 갖고 계신 여러분!이번 주에도 여러 흥미로운 오픈소스 프로젝트들이 새롭게 릴리즈되었습니다.여러분께 도움이 될 만한 주요 릴리즈 소식을 정리해 보았으니, 관심 있는 프로젝트가 있다면 업데이트된 기능과 버그 수정 내용을 확인해 보세요.  제가 평소에 관심있게 살펴보는 프로젝트들입니다.아래 목록에 추가하고 싶은 오픈소스 프로젝트가 있다면, 댓글로 남겨주세요!langchain-ai/langchainhuggingface/transformersvllm-project/vllmNVIDIA/TensorRT-LLMmicrosoft/DeepSpeedollama/ollama   langchain-ai/langchainlangchain-core==0.2.29rc1https://git..
Judging LLM-as-a-Judge with MT-Bench and Chatbot Arena
·
AI/기술,논문 리뷰
https://arxiv.org/abs/2306.05685 Judging LLM-as-a-Judge with MT-Bench and Chatbot ArenaEvaluating large language model (LLM) based chat assistants is challenging due to their broad capabilities and the inadequacy of existing benchmarks in measuring human preferences. To address this, we explore using strong LLMs as judges to evaluate these marxiv.org 논문이 작성되게 된 배경LLM의 빠른 발전과 평가의 한계: 최근 몇 년간 대형 언..
오픈소스 릴리즈 노트 읽기 - 8월 1주차
·
AI/오픈소스 릴리즈 노트
안녕하세요, AI 오픈소스 프로젝트에 관심을 갖고 계신 여러분!이번 주에도 여러 흥미로운 오픈소스 프로젝트들이 새롭게 릴리즈되었습니다.여러분께 도움이 될 만한 주요 릴리즈 소식을 정리해 보았으니, 관심 있는 프로젝트가 있다면 업데이트된 기능과 버그 수정 내용을 확인해 보세요.  제가 평소에 관심있게 살펴보는 프로젝트들입니다.아래 목록에 추가하고 싶은 오픈소스 프로젝트가 있다면, 댓글로 남겨주세요!langchain-ai/langchainhuggingface/transformersggerganov/llama.cppvllm-project/vllmNVIDIA/TensorRT-LLM  langchain-ai/langchainlangchain-core==0.2.25https://github.com/langchain..
langchain / 0.2.12
·
AI/오픈소스 릴리즈 노트
Langchain v0.2.12의 릴리즈 노트에서 주요 변경 사항을 요약하면 다음과 같습니다:Ambiguous root_validator의 업그레이드: 기존의 root_validator를 @pre_init로 업그레이드하였습니다. 이는 코드의 초기화 단계에서의 검증을 더 명확하게 하기 위한 조치입니다.단위 테스트 수정: Pydantic 2와 관련된 문제를 해결하기 위해 단위 테스트가 업데이트되었습니다.타입 주석 추가: 코드에 누락된 타입 주석이 추가되어 코드의 가독성과 유지보수성이 개선되었습니다.init_chat_model 함수 관련 수정:ChatOllama 클래스의 초기화 문제가 수정되었습니다.init_chat_model() 함수가 langchain-ollama와 langchain-community를 폴..
ollama / v0.3.3
·
AI/오픈소스 릴리즈 노트
이번 Ollama v0.3.3 릴리즈는 여러 가지 중요한 업데이트와 수정 사항을 포함하고 있습니다. 주요 변경 사항은 다음과 같습니다:/api/embed 엔드포인트 업데이트: 이제 이 엔드포인트는 total_duration, load_duration, prompt_eval_count와 같은 통계 데이터를 반환합니다. 이를 통해 임베딩 처리에 대한 더 많은 정보를 제공할 수 있게 되었습니다./v1/embeddings API의 사용량 통계 추가: OpenAI 호환성 API에 사용량 통계가 추가되었습니다. 이를 통해 API 사용에 대한 보다 구체적인 통계 데이터를 얻을 수 있습니다./api/generate의 오류 수정:context가 제공되었을 때 빈 문자열을 반환하는 문제를 해결했습니다.context에 대해..
transformers / v4.43.3
·
AI/오픈소스 릴리즈 노트
이번 Hugging Face의 Transformers 릴리즈(v4.43.3)의 주요 내용은 다음과 같습니다:DeepSpeed 관련 수정:DeepSpeed와 함께 사용될 때 임베딩 크기를 조정하는 기능이 추가되었습니다. 이는 사용자가 모델의 임베딩 크기를 더 유연하게 조정할 수 있도록 돕는 기능입니다.기타 수정 사항:Whisper 모델: 짧은 오디오에 대한 출력 형식을 수정하였습니다. 이로 인해 짧은 오디오 처리 시의 온도 설정이 개선되었습니다.BigBird Pegasus 모델: _supports_param_buffer_assignment를 False로 설정하여 새로운 초고속 초기화 기능에서 일부 모델이 이상하게 동작하는 문제를 방지하였습니다.이번 패치는 주로 버그 수정과 성능 개선을 목표로 하고 있으며,..
transformers / v4.43.2
·
AI/오픈소스 릴리즈 노트
이번 transformers v4.43.2는 주로 몇 가지 버그 수정과 개선 사항을 포함한 패치 릴리즈입니다. 주요 변경 사항은 다음과 같습니다:float8_e4m3fn 수정 (PR #32193):modeling_utils에서 float8_e4m3fn에 대한 문제를 수정했습니다. 이는 특정 유형의 부동 소수점 연산과 관련된 문제일 가능성이 있으며, 정확한 연산 및 모델 동작을 보장하기 위한 수정으로 보입니다.Deepspeed와 함께 임베딩 리사이즈 문제 수정 (PR #32192):Deepspeed와 관련된 임베딩 리사이즈 작업에서 발생하는 문제를 해결했습니다. Deepspeed는 대규모 모델 학습을 최적화하기 위한 도구로, 이번 수정은 Deepspeed를 사용하는 모델에서 임베딩 크기를 조정할 때 발생하..