AI는 왜 자꾸 틀리는가
LLM은 답을 계산하지 않고 생성한다. 정확도 100%를 전제로 잡으면 테스트·UX·비용 설계가 깨지고, AI 기능 출시 기준부터 다시 잡아야 함.
- 결정론적 소프트웨어와 달리 같은 입력도 출력이 흔들릴 수 있다. QA는 성공/실패 판정보다 확률 구간을 다뤄야 한다.
- 실패가 에러 메시지가 아니라 그럴듯한 답변으로 온다. 출처 표시, 신뢰도 힌트, 검토 플로우가 제품 안전장치가 된다.
- 정확도 100% KPI는 잘못된 계약이다. 오류 허용 범위, 피해 크기, 복구 비용을 함께 측정해야 한다.