소개

완료됨

생성 AI 애플리케이션은 언어 모델을 기반으로 합니다. 개발 프로세스는 일반적으로 애플리케이션의 특정 요구 사항에 가장 적합한 모델을 찾기 위해 사용 가능한 기본 모델을 탐색하고 비교하는 것으로 시작합니다. 적합한 모델을 선택한 후 클라이언트 애플리케이션 또는 AI 에이전트에서 사용할 수 있는 엔드포인트에 배포합니다.

모델의 GPT 제품군과 같은 기본 모델은 자연어를 이해하고 생성하고 상호 작용하도록 설계된 최첨단 언어 모델입니다. 모델에 대한 몇 가지 일반적인 사용 사례는 다음과 같습니다.

  • 음성 텍스트 변환 및 텍스트 음성 변환. 예를 들어 비디오에 대한 자막을 생성합니다.
  • 기계 번역. 예를 들어 텍스트를 영어에서 일본어로 번역합니다.
  • 텍스트 분류. 예를 들어 메일에 스팸 또는 스팸이 아닌 레이블을 지정합니다.
  • 엔터티 추출. 예를 들어 문서에서 키워드 또는 이름을 추출합니다.
  • 텍스트 요약. 예를 들어 여러 페이지 문서에서 짧은 한 단락 요약을 생성합니다.
  • 질문 답변. 예를 들어 "프랑스의 수도는?"과 같은 질문에 대한 답변을 제공합니다.
  • 추론. 예를 들어 수학 문제를 해결합니다.

이 모듈에서는 질의 답변에 사용되는 기초 모델을 살펴보는 데 중점을 둡니다. 여러분이 살펴보는 기초 모델은 언어 모델을 사용하여 사용자 질문에 대한 응답을 생성하는 채팅 애플리케이션에 사용할 수 있습니다.

참고 항목

생성 AI 모델의 최신 혁신은 변환기 아키텍처의 개발에 빚이 있습니다. 2017년 Vaswani, et al.의 Attention is all you need 논문에 소개되었습니다. Transformer 아키텍처는 NLP에 두 가지 혁신을 제공하여 기본 모델의 출현을 가져왔습니다.

  • Transformers는 단어를 순차적으로 처리하는 대신, 주의를 사용하여 각 단어를 독립적이고 병렬로 처리합니다.
  • 단어 간의 의미 체계적 유사성 외에도 변환기는 위치 인코딩을 사용하여 문장에서 단어의 위치에 대한 정보를 포함합니다.