开源的语音识别和翻译转文本转字幕神器-Mac电脑本地部署Whisper

开源地址:https://github.com/openai/whisper视频教学链接:【MACOS本地部署whisper ai, 一键生成中英文视频字幕】OpenAI Whisper是Whisper 是一种通用语音识别模型。 它是在各种音频的大型数据集上进行训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别.这款模型的开源使得研究人员、开发者和企业可以使...
2024/05/23   pjd   131

可在线体验各类大模型-抱抱脸空间(Hugging Face Spaces)

开源地址:https://huggingface.co/spaces?sort=likes Huggingface Spaces是一个基于云的平台,允许用户轻松地构建、训练和部署先进的AI模型。 它具有以下主要功能: 模型托管- 用户可以在Spaces上托管预训练或定制的Transformer模型,并与他人共享,这些界面通过gradio创快速建前台展示界面。 这包括各种NL...
2024/05/23   pjd   180

在线换衣|在线换装|自动换衣服|神器-VTON

在线体验地址:https://huggingface.co/spaces/yisol/IDM-VTON 注意:微信里打不开,可以在浏览器中打开这个博客页面,可以手机打开,但体验功能不全,建议电脑中操作。 第一步,上传一个模特的照片; 第二步,上传一件你想换上的衣服;第三步,点击Try-on生成新的图片,你看到照片已经将新的衣服...
2024/05/23   pjd   168

全自动合成一个高清的短视频-MoneyPrinterTurbo使用

只需提供一个视频 主题 或 关键词 ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。
2024/05/23   pjd   142

oracle排序效率提升

1、排序字段加索引(优化效果不明显)2、Oracle修改sort_area_size,workarea_size_policy(效果很明显)2.1、 登录dba账号  sqlplus 账号/密码@localhost:1521/数据库名2.2、show parameter sort_area_size; 查看sort_area_size大小默认是65536b(64kb)2....
2024/04/08   pjd   176

Mac电脑本地部署chat-with-mlx

1、安装环境开源地址:https://github.com/qnguyen3/chat-with-mlx准备好miniconda环境,我是从https://docs.anaconda.com/free/miniconda/#latest-miniconda-installer-links 下载安装的pkg安装包。git clone https://github.com/qn...
2024/04/07   pjd   296

Ollama本地部署qwen:32

1、安装Ollama下载地址:www.ollama.com 2、脚本下载模型 ollama run qwen:32b###拉取模型并运行(base) **@~ % ollama run qwen:32bpulling manifestpulling manifestpulling manifestpulling 936798...
2024/04/06   pjd   390

如何理解transformer

transformer 大模型
2024/04/06   seozu_com   184

stable diffusion 原理 / latent image 如何理解

Stable Diffusion是一个深度学习模型,用于生成高质量的图像。它结合了多个先进的深度学习技术,包括变分自编码器(VAE)和U-Net。下面分别介绍UNet和VAE的原理,以及它们在Stable Diffusion模型中的作用。U-NetU-Net是一种卷积神经网络(CNN),最初用于医学图像分割任务。它的结构特点是有一个“U”形的对称结构,因此得名U-Net。这种结...
2024/04/06   pjd   272
1/6