AI Agent에 관해서

5 minute read

Published:

2026/01/17 AI Agent에 관해서

AI 에이전트란?

환경과 상호 작용하고, 데이터를 수집하고, 데이터를 사용하여 사전 결정된 목표를 달성하기 위해 필요한 작업을 “스스로” 결정해서 수행할 수 있는 소프트웨어 프로그램입니다.

단어의 딱딱한 의미는 이렇습니다.

즉 사용자가 프롬포트, 즉 목표를 주면 그 목표를 달성하기 위해 스스로 계획을 짜고 필요한 작업을 결정하고 데이터를 수집하고 사용하여 목표를 달성하는 프로그램입니다.


Ai 에이전트와 기존 LLM과의 차이

기존 LLM(Chatgpt)은 질문에 답변만 해주는 챗봇에 가까웠습니다. 밑에 이렇게 식당예약과 같은 것을 하지 못합니다,

이와 비교해서 AI 에이전트는 이러한 능력이 더해진 능동적인 AI입니다.

  • 목표설정: “~하는 방법을 찾아줘”같은 목표 기반 요청을 이해함
  • 사고(reasoning) : 목표를 달성하려면 어떤 단계를 거쳐야할지 스스로 계획함
  • 도구 사용 : 웹 검색, 계산기, 코드 실행, 외부API 호출 등을 스스로 도구로 실행함
  • 반복과 수정: 자기 피드백을 통해 수정하거나 재시도함

ppt 예시에서 ai agent는 네이버지도, 캐치테이블과 같은 외부 사이트의 api를 사용해 예약을 진행할 수 있습니다.


Agent의 구성

그러면 AI 에이전트의 구성이 어떻게 되어있느냐? 방금 본 위에와 비슷하지만 이렇게 크게 3가지로 나눌 수 있는데요

구성을 보시면 reason, act, momory 로 되어있습니다.

  1. reason(추론)은 LLM을 추론엔진으로 사용해서 목표를 설정하고 목표를 이루기 위한 작업을 세분화해서 계획을 짜는 기능입니다.
  2. act는 그 작업을 수행하기 위한 기능인데, tool을 사용합니다. 아까 말씀드렸던 것처럼 웹검색을 한다던지 이런 날씨앱이나 구글캘린더에 접근해야합니다. 이런 외부 application은 API를 통해서 접근합니다.
  3. memory는 과거 경험을 저장하고 회상하여 인식 및 전체 성능을 향상시키는 능력을 의미합니다. 맥락을 유지하고, 과거 상호작용을 기반으로 적응할 수 있습니다.
    그러니까 추론과 act를 통해서 나온 정보들을 기억하여 나중에 다시 쓸 때 효율적으로 사용할 수 있습니다.

밑 그림

이게 위에서 설명했던 llm이 추론, momory, tool이 있습니다.


Agent의 작동 원리

  1. 사용자가 query를 날립니다. 무언가 사용자가 요청하거나 목표를 줍니다.
  2. agent가 문제를 해결하기위해 어떤 정보가 필요하고 어떤 단계를 거쳐야 하는지 계획을 세운다.
  3. 그 계획과 작업을 토대로 외부 도구를 이용하여 act를 해서 결과를 냅니다
  4. 이 결과가 정답이 확실한지 검토하는 단계도 거칩니다. 오류가 생겼더나 잘못된 답을 도출했다면 다시 plan, think단계로 돌아가 작업을 반복합니다.
  5. 정답이 맞다고 판단되면, 최종 결과를 내놓습니다.

제한점

AI 에이전트는 많은 이점을 제공하지만 사용과 관련된 몇 가지 과제도 있습니다.

  1. AI 에이전트는 미묘한 인간의 감정을 이해하는 데 어려움을 겪을 수 있습니다. 상담, 사회복지, 갈등 해결과 같은 테스크에는 현재 AI에 부족한 수준의 정서적 이해와 공감이 필요합니다. 기존 쿼리에서의 내용은 잘 알아듣지만 쿼리에 말하지 않은 단서를 이해해야 하는 복잡한 사회적 상황에서는 불안정할 수 있습니다.
  2. AI 에이전트는 데이터를 기반으로 결정을 내릴 수 있지만 윤리적으로 복잡한 상황에 필요한 도덕적 기준과 판단력이 부족하다고 합니다. 여기에는 법 집행, 의료(진단 및 치료), 사법 결정과 같은 영역이 포함됩니다.
  3. AI 에이전트는 실시간 적응과 복잡한 운동 기술이 필수적인 매우 역동적이고 예측할 수 없는 물리적 환경에서 어려움을 겪을 수 있습니다. 요즘에 로보틱스와 같은 산업이 정말 많이 발전하고 있지만 아직 ai에이전트에 다 맞길정도로는 아닙니다. 여기에는 수술, 특정 유형의 건설 작업, 재해 대응과 같은 테스크가 포함됩니다.
  4. 리소스 집약적인 애플리케이션 - 정교한 AI 에이전트를 개발하고 배포하는 데는 많은 리소스와 컴퓨팅 리소스가 필요하므로 예산이 제한적인 소규모 프로젝트나 조직에는 적합하지 않을 수 있습니다.

다음으로는 AI 에이전트를 유형별로 나눠보았습니다. 우선 상호작용을 하는 방식을 기준으로 나눠보았습니다.

직접 대화를 나누는 에이전트가 있는가 하면, 백그라운드에서 작동하여 직접적인 사용자 입력 없이 태스크를 수행하는 에이전트도 있습니다.

  • 대화형 파트너(표면형 에이전트라고도 함)
    1. 일반적으로 사용자 쿼리로 시작됨
    2. Q&A, 잡담, 인간과의 세상의 지식 상호작용
    3. 고객 서비스 챗봇, 교육 튜터, 개발 도우미, 과학 연구 지원
  • 자율 백그라운드 프로세스(백그라운드 에이전트라고도 함)
    1. 인적 상호작용이 제한적이거나 거의 없음!
    2. 백그라운드에서 작동되어 일상적인 Task를 자동화함
    3. 데이터를 분석하여 유용한 정보를 도출
    4. 로그 분석, 자동 리포트 생성, 데이터 파이프라인 자동화

상시운영되는 , 개발에서 (백엔드같은 영역?)이라고 볼 수 있을 것 같습니다,


이번에는 에이전트 수 기준으로 나눠봤는데요

에이전트 수 기준

  • 단일 에이전트:
    1. 특정 목표를 달성하기 위해 독립적으로 작동합니다.
    2. 외부 도구와 리소스를 활용하여 테스크를 수행하고 다양한 환경에서 기능을 강화합니다.
    3. 다른 AI 에이전트와의 협업이 필요하지 않은 명확한 태스크에 가장 적합합니다.

의사결정 주체는 하나

비유를 들자면 “혼자서 끝까지 책임지는 1인 전문가”

  • 멀티 에이전트
    1. 공동의 목표 또는 개별 목표를 달성하기 위해 협력하거나 경쟁하는 여러 AI 에이전트입니다.
    2. 이러한 시스템은 개별 에이전트의 다양한 기능과 역할을 활용하여 복잡한 태스크를 처리합니다.
    3. 멀티 에이전트 시스템은 대화형 시나리오에서 대인 커뮤니케이션과 같은 인간의 행동을 시뮬레이션할 수 있습니다.

“각자 전문 분야가 있는 팀”


AI 에이전트 활용 사례

활용사례인데요 우선 구글 클라우드에서 사례를 6가지 범주로 나눈 것으로 설명드리겠습니다.

ppt자료에 있습니다.


이건 기업에서 활용하고 있는 구체적인 사례입니다.

AI가 웹 인터페이스와 직접 상호작용하는 서비스입니다. GPT의 비전 기능과 강화 학습을 결합한 컴퓨터 사용 에이전트모델을 활용한 새로운 AI 형태로, GUI와의 상호작용이 가능한 자율형 AI 에이전트입니다.

  • Anthropic “Computer Use”는 언어 모델 Claude 3.5에 추가된 업무 자동화 도구 서비스입니다.

이 기능을 통해 Claude는 실제 사람처럼 컴퓨터 화면을 보고, 마우스 커서를 움직이고, 버튼을 클릭하는 등의 작업을 수행할 수 있게 되었습니다.

  • Microsoft “Copilot”Microsoft의 Copilot에는 문서 작업 등 업무를 자동화하는 다양한 AI 에이전트가 있습니다.
    1. 셰어포인트 에이전트 : 특정 사이트나 파일, 폴더를 연동해 필요한 정보를 쉽게 찾을 수 있도록 도와주는 기능
    2. 직원 셀프서비스 에이전트 : 직원의 휴가 신청 관리와 급여 및 복지 정보 확인, 장비 요청 등을 대신 처리해주는 기능
    3. 통역 에이전트 : 화상 회의 중 사용자 간 대화 내용을 9개 국어로 실시간 통역해주는 기능
    4. 프로젝트 매니저 에이전트 : 프로젝트 계획 수립부터 실행까지의 모든 과정을 자동화하는 기능

Agentic AI는

더 높은 수준의 자율성, 상황 인식 및 적응력을 갖춘 보다 진보된 형태로, 목표를 설정하고, 환경에서 학습하고, 윤리적이고 맥락적 고려 사항을 포함하는 복잡한 결정을 내리는 것입니다.

표에서 보시는 것과 마찬가지고 AI agent와 다르게 수동적이지 않고 상황을 인식해 목표를 재설정하고 유동적으로 상황에 적응해나가는 에이전트입니다.

더 고차원수준의 모델이라고 볼 수 있겠습니다.