pfldy2850 2024. 8. 3. 21:02

이번 Ollama v0.3.3 릴리즈는 여러 가지 중요한 업데이트와 수정 사항을 포함하고 있습니다. 주요 변경 사항은 다음과 같습니다:

  1. /api/embed 엔드포인트 업데이트: 이제 이 엔드포인트는 total_duration, load_duration, prompt_eval_count와 같은 통계 데이터를 반환합니다. 이를 통해 임베딩 처리에 대한 더 많은 정보를 제공할 수 있게 되었습니다.
  2. /v1/embeddings API의 사용량 통계 추가: OpenAI 호환성 API에 사용량 통계가 추가되었습니다. 이를 통해 API 사용에 대한 보다 구체적인 통계 데이터를 얻을 수 있습니다.
  3. /api/generate의 오류 수정:
    • context가 제공되었을 때 빈 문자열을 반환하는 문제를 해결했습니다.
    • context에 대해 잘못된 값을 반환하는 문제를 수정했습니다.
  4. /show modefile 개선: 이제 MESSAGE 명령이 올바르게 렌더링됩니다.

 

https://github.com/ollama/ollama/releases/tag/v0.3.3

 

Release v0.3.3 · ollama/ollama

What's Changed The /api/embed endpoint now returns statistics: total_duration, load_duration, and prompt_eval_count Added usage metrics to the /v1/embeddings OpenAI compatibility API Fixed issue w...

github.com