M — 咖啡馆社交机器人

基于 GPT-4o 的情感陪伴社交机器人，部署于真实咖啡馆环境

在真实咖啡馆环境中设计并部署了一款基于 GPT-4o 的社交机器人，专注于情感陪伴与自然对话，而非单纯的点单交互。

系统架构

构建完整对话流水线，包含意图分类（SMALL_TALK / TASK_ORDER / TASK_RECOMMEND / TASK_ROBOT）、基于摄像头的情绪监测、STT/TTS 语音交互界面，以及经 Docker 容器化的 ROS2 机器人控制模块。

迭代共同设计

主导两轮迭代式 co-design：招募参与者开展实地会话，通过 Whisper API 转写交互内容，结合对话日志分析与会后访谈提炼设计需求，并进行纵向对比。

LLM 行为工程

识别并修复了 LLM 的核心行为缺陷——话题锁定在咖啡、情绪触发强推饮品、回应流于泛泛——通过系统化 prompt 重设计，并在 system prompt 中注入 5 组 BAD/GOOD few-shot 示例对加以修正。
实现了基于对话上下文（情绪状态、疲劳程度、偏好表达）的情境感知饮品推荐模式（TASK_RECOMMEND），并引入状态机保证多轮对话的连贯性。

成果

第二轮迭代中，8 个行为维度均获得确认改善；两位参与者均表示无需调整自身沟通方式即可自然与机器人交流。

课程： 人机交互（EN601.691），约翰斯·霍普金斯大学