감정 분석 사이트 만들기 - 개발 및 테스트

admin | | 조회 10


[주요 목차]

프로젝트 초기 설정과 Taskmaster 활용

AI 기반 감정 분석 사이트 개발

Playwright 테스트와 모델 검증


감정 분석 사이트를 만들어보고 싶은데 어디서부터 시작해야 할지 막막한가요? 저도 처음엔 PRD와 TRD만 덩그러니 놓고 코드를 어떻게 짜야 할지 고민이 많았거든요. 이번 글에서는 실제로 Taskmaster와 MCP를 활용해 감정 분석 사이트를 개발하고, Playwright로 테스트까지 진행한 과정을 자세히 풀어보려고 해요. 이 글을 끝까지 읽으면 프로젝트 폴더 세팅부터 실전 테스트, 모델 문제점까지 한 번에 이해할 수 있을 거예요. 특히 한국어 감정 분석에서 흔히 겪는 모델 한계와 그걸 어떻게 확인했는지 실무 팁도 담았습니다. 감정 분석 사이트 만들기 과정이 궁금하다면 지금 바로 따라와 보세요.


감정 분석 사이트 만들기 - 개발 및 테스트 - 주요 포인트 1 - 감정분석사이트감정 분석 사이트 만들기 - 개발 및 테스트 · 주요 포인트 1

프로젝트 초기 설정과 Taskmaster 활용

새로운 프로젝트를 시작할 때는 먼저 폴더를 만들고 PRD, TRD 문서를 MD 파일로 정리하는 게 제일 중요하더라고요. 지난번에 작성해둔 PRD 전체를 복사해서 넣고, TRD는 하단 내용만 따로 발라내서 저장했어요. 이렇게 문서를 미리 넣어두면 Taskmaster가 테스크를 생성할 때 훨씬 정확한 지시를 내릴 수 있거든요.

터미널을 열고 Taskmaster 토비화를 실행한 뒤, 좌측에 테스크 목록이 뜨면 바로 프롬프트를 날렸습니다. “Taskmaster와 MCP에 테스크를 체크하면서 감정 분석 사이트를 개발해 달라”고 요청하니까 자동으로 테스크가 쭉 생성되더라고요. 현업에서는 이렇게 문서를 기반으로 테스크를 자동화하면 개발 속도가 2~3배는 빨라지는 걸 자주 느꼈어요.

업세트를 눌러 진행을 시작하면 Taskmaster가 테스크를 하나씩 처리하면서 코드를 생성합니다. 이때 중요한 건 PRD와 TRD 내용을 최대한 구체적으로 넣는 거예요. 그래야 나중에 “감정 분석 결과가 안 나와요” 같은 문제가 줄어들거든요. 저는 이 단계에서 모바일 반응형까지 고려한 레이아웃 지시를 추가했더니 처음부터 꽤 괜찮은 형태로 나왔습니다.

감정 분석 사이트 만들기 - 개발 및 테스트 - 주요 포인트 2 - 감정분석사이트감정 분석 사이트 만들기 - 개발 및 테스트 · 주요 포인트 2

AI 기반 감정 분석 사이트 개발

개발이 어느 정도 진행되자 브라우저가 자동으로 열리면서 실시간으로 사이트가 만들어지는 걸 볼 수 있었어요. 문장을 입력하고 ‘분석하기’ 버튼을 누르니 긍정/부정 결과와 추천 응답까지 바로 출력되더라고요. 클릭하면 복사되는 기능도 자연스럽게 들어가 있었고, 신뢰도 수치까지 함께 보여줘서 UX가 생각보다 좋았습니다.

다만 테스트를 진행하면서 몇 가지 한계가 드러났어요. “우울”이라는 단어가 들어간 문장을 넣었을 때 긍정으로 잘못 판단하거나, 신뢰도가 60% 이하로 떨어지는 경우가 있었거든요. “내일이 너무 기대돼요”처럼 명확한 긍정 문장에서도 신뢰도가 낮게 나오는 걸 보고, 단순 키워드 매칭이 아니라 실제 모델 성능 문제라는 걸 알게 됐습니다.

그래서 AI에게 “긍정·부정·중립 각각 3개씩 예시 문장을 만들어서 감정 분석이 제대로 되는지 확인해 달라”고 추가 지시를 내렸어요. 중요한 건 더미 데이터가 아닌 실제 한국어 모델 결과를 요청한 점입니다. 바이브 코딩을 하다 보면 가짜 데이터를 보여주는 경우가 많은데, 이렇게 명확히 “한국어 모델 결과로 보여줘”라고 하면 나중에 디버깅할 때 훨씬 수월하더라고요.

감정 분석 사이트 만들기 - 개발 및 테스트 - 실전 화면 3 - 감정분석사이트감정 분석 사이트 만들기 - 개발 및 테스트 · 실전 화면 3

Playwright 테스트와 모델 검증

Playwright MCP를 활용해 브라우저 테스트를 자동화하니까 중간중간 감정 분석 결과를 실시간으로 확인할 수 있었어요. 테스트 문장 목록이 나오고, 채팅창에 신뢰도와 결과가 함께 출력되는 걸 보면서 “이게 실제로 모델이 돌고 있구나”를 눈으로 확인할 수 있었습니다. 기능 자체는 잘 작동했지만, 결과가 맞지 않는 부분이 명확히 보이더라고요.

긍정 문장은 대부분 잘 나왔는데 중립과 부정에서는 오류가 꽤 있었어요. 직접 모델 실행 여부를 확인해 보니 KoBERT가 아닌 다른 모델이 사용되고 있더라고요. 한국어 감정 분석에는 아직 부적합한 모델이었던 거죠. 그래서 “한국 특화 모델로 교체하고 KoBERT 기반 감정 분석 모델을 적용하라”는 개선 방안을 Taskmaster에 요청했습니다.

실무에서 이런 모델 문제는 흔하게 겪는데, 이번처럼 Playwright로 끝까지 테스트하면서 발견하면 다음 개발 단계에서 바로 반영할 수 있어요. 다음 시간에는 실제로 한국어 특화 모델을 교체하면서 정확도를 높여보는 과정을 이어서 다뤄볼게요. 지금 당장 따라 해보고 싶은 분은 PRD와 TRD부터 정리해 보세요.


[자주 묻는 질문]

Taskmaster로 감정 분석 사이트 개발할 때 PRD와 TRD는 어떻게 작성해야 하나요?

PRD에는 전체 서비스 목표와 사용자 흐름을, TRD에는 기술 스택과 API 명세를 구체적으로 적는 게 좋아요. 저는 지난번에 작성한 문서를 그대로 복사해서 넣었는데, Taskmaster가 테스크를 생성할 때 훨씬 정확한 결과를 주더라고요. 특히 감정 분석 결과 출력 형식이나 신뢰도 표시 방식을 미리 명시하면 개발 후 수정이 줄어듭니다.

Playwright MCP로 테스트할 때 더미 데이터가 아닌 실제 모델 결과를 확인하는 방법은?

프롬프트에 “더미 데이터가 아닌 한국어 모델에서 나오는 실제 결과를 보여줘”라고 명확히 지시하세요. 이렇게 하면 AI가 가짜 데이터를 만들지 않고 진짜 모델을 호출해서 테스트해 주거든요. 저는 이 과정을 통해 중립·부정 감정에서 모델이 제대로 동작하지 않는 걸 바로 발견할 수 있었습니다.

현재 사용한 모델이 한국어 감정 분석에 부적합하다면 어떤 모델로 바꿔야 하나요?

KoBERT 기반 한국어 감정 분석 모델을 추천합니다. 기존 모델은 긍정은 어느 정도 잡아내지만 부정과 중립에서 정확도가 떨어지더라고요. 다음 개발 단계에서 모델을 교체하고 다시 테스트하면 신뢰도 80% 이상으로 올라가는 걸 확인할 수 있을 거예요.

목록
글쓰기
한국 서버호스팅
전체보기 →

댓글 0