🚀   70세 이전에 한 모든 일은 신경 쓸 가치가 없다. - 호쿠사이

Ollama에서 사용할 수 있는 주요 모델들

2024.08.03
11분

llama 파생 모델

주요 모델에 대한 간략 설명

Ollama에서 사용할 수 있는 여러 모델들이 나오고 있습니다. 오픈소스로 공개되기 때문에 기존 모델을 변형하거나 개선하는 등으로 파생 모델이 만들어지는 경우도 많습니다.

이러한 모델들은 각기 다른 특성과 용도를 가지고 있으며, 필요에 따라 적합한 모델을 선택하여 사용할 수 있습니다. Ollama를 통해 쉽게 설치하고 활용할 수 있으며, 각 모델의 구체적인 사용 방법과 예시는 Ollama 공식 라이브러리에서 확인할 수 있습니다.

Llama 2

  • 설명: Meta Platforms, Inc.에서 개발한 Llama 2 모델은 2조 개의 토큰으로 학습되었으며, 4096개의 컨텍스트 길이를 기본으로 지원합니다. Llama 2 Chat 모델은 100만 개 이상의 인간 주석으로 미세 조정되어 대화에 최적화되어 있습니다.
  • 용도: 대화, 자연어 처리 작업.
  • 링크: (https://ollama.com/library/llama2)

Llama 3

  • 설명: Llama 3은 최신 상태의 모델로, 8B 및 70B 매개변수 크기로 제공됩니다. 이 모델은 많은 오픈 소스 채팅 모델을 능가하는 성능을 자랑하며, 대화 및 텍스트 생성 작업에서 뛰어난 성능을 발휘합니다.
  • 용도: 고급 대화, 자연어 처리.
  • 링크: (https://ollama.com/library/llama3)

Llama 3.1

  • 설명: 2024년 7월 23일 공개된 최신 상태의 모델로, 8B 및 70B, 405B 매개변수 크기로 제공됩니다. 이 모델은 많은 오픈 소스 채팅 모델을 능가하는 성능을 자랑하며, 이중 가장 큰 405B 모델은 약 4050개의 매개변수를 가지고 있어 GPT-4o, Claude 3.5 Sonnet과 견줄만한 성능을 갖추었다. 컨텍스트 창은 50페이지 분량인 12만8000 토큰을 지원합니다.
  • 용도: 고급 대화, 자연어 처리.
  • 링크: (https://ollama.com/library/llama3.1)

Gemma

  • 설명: Google DeepMind에서 개발한 최신 모델 시리즈로, 2B 및 7B 매개변수 크기로 제공됩니다. Gemma는 다양한 웹 문서를 기반으로 학습하여 광범위한 언어 스타일, 주제 및 어휘에 익숙합니다. 고효율 모델로, 경량화와 성능을 모두 충족시킵니다.
  • 용도: 대화, 텍스트 생성, 언어 이해.
  • 링크: (https://ollama.com/library/gemma)

Gemma 2

  • 설명: Gemma 모델의 향상된 버전으로, 9B 및 27B 매개변수 크기로 제공됩니다. 이 모델은 더 작은 크기의 모델들보다 뛰어난 성능을 발휘하며, 복잡한 언어 처리 작업에 적합합니다.
  • 용도: 고급 텍스트 생성, 자연어 처리, 대화형 AI.
  • 링크: (https://ollama.com/library/gemma2)

CodeGemma

  • 설명: 코드 생성과 관련된 작업을 수행하도록 설계된 모델입니다. CodeGemma는 코드 완성, 코드 생성, 자연어 이해, 수학적 추론, 명령어 따르기 등 다양한 코딩 작업을 지원합니다.
  • 용도: 코드 생성, 프로그래밍 학습 보조.
  • 링크: (https://ollama.com/library/codegemma)

Mistral 7B

  • 설명: Mistral 7B는 70억 개의 매개변수를 가진 모델로, 텍스트 완성과 명령어 따르기에 적합하게 설계되었습니다. 최신 버전에서는 함수 호출을 지원합니다.
  • 용도: 텍스트 생성, 대화, 명령어 따르기.
  • 링크: (https://ollama.com/library/mistral)

Mistral NeMo

  • 설명: NVIDIA와의 협업을 통해 개발된 Mistral NeMo는 120억 개의 매개변수를 가진 모델로, 최대 128k 토큰의 큰 컨텍스트 창을 지원합니다. 논리적 추론, 세계 지식 및 코드 정확성에서 뛰어난 성능을 보입니다.
  • 용도: 복잡한 언어 작업, 긴 텍스트 분석, 코딩.
  • 링크: (https://ollama.com/library/mistral-nemo)

Mistral Large

  • 설명: Mistral Large 2는 수학, 논리적 추론, 코드 생성에서 뛰어난 성능을 보이는 모델로, 최대 128k 컨텍스트 창을 지원합니다. 다양한 언어를 처리할 수 있습니다.
  • 용도: 고급 텍스트 생성, 다국어 지원, 코드 생성.
  • 링크: (https://ollama.com/library/mistral-large)

Yarn Mistral

  • 설명: Yarn Mistral은 Mistral 모델을 기반으로 컨텍스트 창 크기를 128k 토큰까지 확장한 모델입니다. YaRN 방법을 사용하여 긴 컨텍스트 창을 효과적으로 처리할 수 있습니다.
  • 용도: 긴 텍스트 분석, 복잡한 문서 처리.
  • 링크: (https://ollama.com/library/yarn-mistral)

Mistral OpenOrca

  • 설명: Mistral OpenOrca는 Mistral 7B 모델을 기반으로 OpenOrca 데이터셋을 사용해 미세 조정된 모델입니다. 30B 이하 모델 중에서 최고 성능을 자랑합니다.
  • 용도: 고급 텍스트 생성, 대화형 AI.
  • 링크: (https://ollama.com/library/mistral-openorca)

Dolphin Mistral

  • 설명: Dolphin 모델은 Mistral 0.2 버전을 기반으로 한 모델로, 검열되지 않은 형태로 제공됩니다. 주로 코딩 작업에 뛰어난 성능을 보입니다.
  • 용도: 코드 생성, 프로그래밍.
  • 링크: (https://ollama.com/library/dolphin-mistral)

OpenHermes 2

  • 설명: OpenHermes 2는 Mistral 7B를 기반으로 완전히 공개된 데이터셋을 사용해 미세 조정된 모델입니다. 다중 회차 대화와 시스템 프롬프트 기능에서 뛰어난 성능을 보입니다.
  • 용도: 대화형 AI, 시스템 프롬프트.
  • 링크: (https://ollama.com/library/openHermes)

Codestral

  • 설명: Codestral은 Mistral AI의 첫 번째 코드 모델로, 220억 개의 매개변수를 가지고 있으며 80개 이상의 프로그래밍 언어를 지원합니다. 코드 생성, 함수 완성, 테스트 작성 등의 작업에 탁월합니다.
  • 용도: 코드 생성, 프로그래밍 학습 보조.
  • 링크: (https://ollama.com/library/codestral)

Solar

  • 설명: 10.7B 매개변수를 가진 소형 모델로, Llama 2 아키텍처와 Mistral 7B 가중치를 통합한 Depth Up-Scaling 기술을 사용합니다. 30B 매개변수 이하의 모델 중에서 뛰어난 성능을 자랑합니다.
  • 용도: 효율적인 텍스트 생성, 자원 절약형 AI 작업.
  • 링크: (https://ollama.com/library/solar)

Orca Mini

  • 설명: Orca 스타일 데이터셋으로 학습된 Llama 및 Llama 2 모델입니다. Orca Mini는 두 가지 변형으로 제공되며, 복잡한 설명 추적을 통해 학습된 것이 특징입니다. 보급형 하드웨어에 적합합니다.
  • 용도: 텍스트 분석, 데이터 요약.
  • 링크: (https://ollama.com/library/orca-mini)

Code Llama

  • 설명: Llama 2를 기반으로 코드를 생성하고 설명하는 모델로, 개발자들의 작업을 빠르고 효율적으로 도와줍니다. 이 모델은 코드 생성 및 코드 관련 자연어 처리를 지원합니다.
  • 용도: 코드 생성, 프로그래밍 학습 보조.
  • 링크: (https://ollama.com/library/codellama)

Phi-3

  • 설명: Microsoft에서 개발한 Phi-3 모델은 3.8B 매개변수를 가진 트랜스포머 모델로, 인간의 선호도 및 안전 가이드라인에 맞춰 미세 조정되었습니다. 128K 토큰의 컨텍스트 길이를 지원합니다.
  • 용도: 고급 텍스트 생성, 대화형 AI.
  • 링크: (https://ollama.com/library/phi3)

Llama 2 Uncensored

  • 설명: Llama 2 모델의 변형으로, 검열되지 않은 자유로운 형태로 정보를 제공하는 모델입니다. 이는 사용자 정의 및 고급 텍스트 생성 작업에 유용합니다.
  • 용도: 자유로운 텍스트 생성, 사용자 정의 작업.
  • 링크: (https://ollama.com/library/llama2-uncensored)

Vicuna

  • 설명: Vicuna는 Llama를 미세 조정한 대화형 모델로, 3가지 크기로 제공됩니다. 이 모델은 사용자와 자연스럽고 상세한 대화를 할 수 있도록 설계되었습니다.
  • 용도: 고객 지원, 대화형 AI.
  • 링크: (https://ollama.com/library/vicuna)

프로필 사진
Nanutbae
A small boat sailing freely on the sea of curiosity ⊹ ࣪ ﹏𓊝﹏𓂁﹏⊹ ࣪ ˖