图中是一个基于Whisper模型的音频转文字应用,可以成批的将音视频转化为文本。适用于会议记录、调研录音、网课学习等场景,这个软件针对这个功能,提供了非常高效的GUI程序,对懂技术的人很好用,对不懂技术的,那堆参数设置就是劝退宝典。
基于典型办公场景的需求,把前后端的AI应用、agent订制、技术支持、算力服务打包,应该会有不错的市场空间的。技术门槛其实不高,难的是市场资源和商业模式。可以白嫖的资源太多了,产品化的服务才是主要卖点