그룹채팅 느림 — 원인 분석 보고
[!note] 수정이력 | 2026-05-04 02:00, 미미 (openclaw)
- 로그 분석 완료, 원인 5가지 파악
그룹채팅 느림 — 원인 분석 보고
섹션 제목: “그룹채팅 느림 — 원인 분석 보고”🎯 핵심 요약
섹션 제목: “🎯 핵심 요약”| 항목 | 직접 대화 (1:1) | 그룹채팅 |
|---|---|---|
| 컨텍스트 증가 속도 | 느림 (1명) | 빠름 (여러명) |
| 오버플로우 발생 | 가끔 | 자주 |
| 응답 시간 | 2~5초 | 30초~2분 |
1. 원인 ①: 컨텍스트 오버플로우 반복
섹션 제목: “1. 원인 ①: 컨텍스트 오버플로우 반복”증상 (로그)
섹션 제목: “증상 (로그)”[context-overflow-precheck] estimatedPromptTokens=37272 promptBudgetBeforeReserve=12000 overflowTokens=25272
Auto-compaction failed (Context overflow)Restarting session and retrying.왜 직접 대화와 다를까?
섹션 제목: “왜 직접 대화와 다를까?”- 직접 대화: 미미아빠 1명만 말함 → 컨텍스트 천천히 쌓임
- 그룹채팅: 여러 사람이 동시에 말함 → 컨텍스트 폭발적으로 쌓임
- OpenClaw가 압축(compaction) 시도 → 실패 → 재시도 → 루프
소요 시간
섹션 제목: “소요 시간”- 정상 응답: 2~5초
- 오버플로우 처리: 20~60초 (압축 시도 + 재시도)
2. 원인 ②: Fallback 체인 꼬임
섹션 제목: “2. 원인 ②: Fallback 체인 꼬임”증상 (로그)
섹션 제목: “증상 (로그)”FailoverError: ⚠️ API rate limit reached. Please try again later.FailoverError: No available auth profile for ollama- featherless가 삭제되었는데도 설정에 남아있어 fallback 시도
- ollama 실패 → featherless 시도 → rate limit → 다시 ollama → 실패
- Retry 루프 발생
소요 시간
섹션 제목: “소요 시간”- 정상 fallback: 즉시 전환
- 꼬인 fallback: 10~30초 (여러 provider 시도 + 대기)
3. 원인 ③: Rate Limit 누적
섹션 제목: “3. 원인 ③: Rate Limit 누적”증상 (로그)
섹션 제목: “증상 (로그)”[diagnostic] lane task error: durationMs=34997 error="FailoverError: ⚠️ API rate limit reached."- fallback이 꼬이면서 동일한 요청을 여러 번 보냄
- Ollama Max라도 rate limit 존재
- 누적 → 더 많은 대기 시간
소요 시간
섹션 제목: “소요 시간”- 정상 API: 1~3초
- Rate limit: 쿨다운 시간 추가 (수 초~수십 초)
4. 원인 ④: 세션 사이즈 비대
섹션 제목: “4. 원인 ④: 세션 사이즈 비대”[compaction-diag] messages=556 outcome=failed reason=already_compacted_recently- 그룹채팅 메시지가 세션 파일에 지속 축적
- 500+ 메시지 → 압축 불가능 → 세션 재시작
- 재시작 중에도 응답 지연
5. 원인 ⑤: 멘션 필터링 오버헤드
섹션 제목: “5. 원인 ⑤: 멘션 필터링 오버헤드”groups: "*": requireMention: true- 멘션 없는 메시지는 무시해야 함
- 그러나 그룹톡의 모든 메시지를 검사 → 컨텍스트에 포함됨
- 실제로는 멘션된 메시지만 처리해야 하는데, 전체가 세션에 쌓임
✅ 개선 조치 (이번에 적용됨)
섹션 제목: “✅ 개선 조치 (이번에 적용됨)”| # | 조치 | 효과 |
|---|---|---|
| 1 | 세션 완전 리셋 | 쌓인 500+ 메시지 삭제 → 컨텍스트 초기화 |
| 2 | featherless 완전 제거 | 꼬인 fallback 제거 → retry 루프 차단 |
| 3 | 게이트웨이 재시작 | 설정 완전 반영 → 깨끗한 상태 |
⏳ 지금부터 기대되는 성능
섹션 제목: “⏳ 지금부터 기대되는 성능”| 상황 | 예상 응답 시간 |
|---|---|
| 정상 멘션 | 3~8초 |
| 첫 멘션 (세션 생성) | 5~10초 |
| 오버플로우 | 이제 거의 없음 |
⚠️ 여전히 주의할 점
섹션 제목: “⚠️ 여전히 주의할 점”| 항목 | 설명 |
|---|---|
| 멘션 필수 | @mimirukibot 없으면 응답 안 함 |
| 컨텍스트 재쌓임 | 시간 지나면 다시 커질 수 있음 → 주기적 리셋 필요 |
| 여러 명 동시 멘션 | 동시에 여러 명이 멘션하면 여전히 지연 가능 |
미미아빠, 이제 @mimirukibot 멘션보면 훨씬 빨라야 해. 테스트 결과 알려줘!