Git репозиторий - публичные и приватные гит репозитории | GitVerse

Обзор Центр заботыВойти

Сортировать по

Язык: Все

Топик: evaluation

rnekrasov/
TrustLLM
(ICML 2024) TrustLLM: Trustworthiness in Large Language Models
llm
ai
nlp
large-language-models
natural-language-processing
benchmark
evaluation
toolkit
pypi-package
dataset
trustworthy-ai
trustworthy-machine-learning
Python
0
2
Обновлено 5 месяцев назад
rnekrasov/
promptfoo
Test your prompts, models, and RAGs. Catch regressions and improve prompt quality. LLM evals for OpenAI, Azure, Anthropic, Gemini, Mistral, Llama, Bedrock, Ollama, and other local & private models with CI/CD integration.
llm
rag
llmops
prompt-engineering
testing
prompts
evaluation-framework
evaluation
llm-eval
cicd
ci-cd
ci
llm-evaluation
llm-evaluation-framework
prompt-testing
TypeScript
0
1
Обновлено 6 месяцев назад
rnekrasov/
lunary
The production toolkit for LLMs. Observability, prompt management and evaluations.
llm
ai
hacktoberfest
langchain
openai
monitoring
observability
testing
prompts
self-hosted
evaluation
logs
TypeScript
0
0
Обновлено 7 месяцев назад
natasha-nlp/
naeval
Comparing quality and performance of NLP systems for Russian language
python
nlp
russian
evaluation
performance-analysis
Python
0
0
Обновлено 4 месяца назад

Использование cookies

Мы используем файлы cookie в соответствии с Политикой конфиденциальности и Политикой использования cookies.

Нажимая кнопку «Принимаю», Вы даете АО «СберТех» согласие на обработку Ваших персональных данных в целях совершенствования нашего веб-сайта и Сервиса GitVerse, а также повышения удобства их использования.

Запретить использование cookies Вы можете самостоятельно в настройках Вашего браузера.