下载简历

数字人

完全基于开源项目实现图像-数字人制作全流程,形象和音色基于本人信息生成
  • 图片编辑: 通过图片编辑,即可创造同一人物的不同形象和场景。
  • 音色克隆: 无需训练,快速复刻音色与情感。
  • 图生视频: 通过首尾帧控制,生成流畅自然的数字人视频,有效解决表情、动作生硬问题。
  • 对口型: 完美解决口型问题,提升数字人表现力。

AI 视频

利用 AI 技术生成视频内容。

AI 视频 1
AI 视频 2
  • AI 剧本生成: 仅需输入构思,即可利用 LLM 自动生成分镜画面提示词,显著加速剧本创作流程。
  • 文生图: 基于分镜画面提示词,利用本地 ComfyUI 实现图像生成,并确保角色一致性。
  • 图生视频: 基于开源模型,实现高质量的图生视频效果。
  • AI 音效生成: 演示视频中的部分音效使用开源项目生成,有效提升视频的沉浸感。

小说自动化生产发布平台

实现小说从生产到发布的零人工介入
  • 多角色话本生成: 利用 LLM 技术,自动将小说转化为多角色话本,丰富内容形式。
  • 专业翻译策略: 针对长篇小说,解决专有名词(人名、地名、中文特有表达)翻译一致性问题,保证翻译质量。
  • 智能 TTS 配音: 通过工程策略优化,自动匹配多角色音色,无需人工选音色。
  • AI 绘画: 使用 Llama 模型生成图片提示词,并利用本地 ComfyUI 生成高质量插图,提升视觉效果。

短剧多语言生产平台

中文原声
印尼语
基于开源项目,实现短剧的硬字幕处理、人声分离、硬字幕提取、多语言翻译和 TTS 功能。
  • 硬字幕处理: 基于开源项目实现硬字幕擦除,提升视频观看体验。
  • 人声分离: 基于开源项目实现人声分离,便于后期其余工作流的处理。
  • 硬字幕提取: 结合开源项目与 LLM 模型,实现高准确度的硬字幕提取。
  • 多语言翻译: 基于 LLM 实现多语言翻译,无需人工审校,提高翻译效率。
  • TTS: 演示视频采用闭源商用解决方案。