开源项目WeClone:用微信聊天记录,做个“数字版的你”,某种意义上实现“数字永生”。 该项目可以把AI调成模仿你的口气说话,再接入聊天机器人,实现属于你自己的“数字分身”。 来看下它具体能干嘛: - 支持从微信导出聊天记录,并自动处理成问答格式 - 基于LoRA方法、微调Qwen2.5-7B等模型,让LLM说话更像你 - 还能克隆语音,基于0.5B模型重现你的语气语调(配套子项目:WeClone-audio) - 最终结果可以部署到微信/QQ/飞书/企微等多平台,实现聊天式交互 WeClone也贴心地给出了详细的流程文档,从环境配置、数据处理 到 模型训练、服务部署都有说明。 还支持单卡/多卡训练、FlashAttention加速、LoRA参数配置等技术细节,适合技术向用户上手。 不过要注意几点: - 微调效果依赖聊天数据的质量和模型大小 - Windows下建议用WSL(Linux内核) - 当前版本正在快速迭代中,不稳定属正常现象 - 涉及隐私数据,一定要合法合规使用 感兴趣的可以上GitHub看源码: