开源的语音识别和翻译转文本转字幕神器-Mac电脑本地部署Whisper
开源地址:https://github.com/openai/whisper视频教学链接:【MACOS本地部署whisper ai, 一键生成中英文视频字幕】OpenAI Whisper是Whisper 是一种通用语音识别模型。 它是在各种音频的大型数据集上进行训练的,也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别.这款模型的开源使得研究人员、开发者和企业可以使...
2024/05/23
pjd
109
可在线体验各类大模型-抱抱脸空间(Hugging Face Spaces)
开源地址:https://huggingface.co/spaces?sort=likes Huggingface Spaces是一个基于云的平台,允许用户轻松地构建、训练和部署先进的AI模型。 它具有以下主要功能: 模型托管- 用户可以在Spaces上托管预训练或定制的Transformer模型,并与他人共享,这些界面通过gradio创快速建前台展示界面。 这包括各种NL...
2024/05/23
pjd
139
在线换衣|在线换装|自动换衣服|神器-VTON
在线体验地址:https://huggingface.co/spaces/yisol/IDM-VTON 注意:微信里打不开,可以在浏览器中打开这个博客页面,可以手机打开,但体验功能不全,建议电脑中操作。 第一步,上传一个模特的照片; 第二步,上传一件你想换上的衣服;第三步,点击Try-on生成新的图片,你看到照片已经将新的衣服...
2024/05/23
pjd
135
全自动合成一个高清的短视频-MoneyPrinterTurbo使用
只需提供一个视频 主题 或 关键词 ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。
2024/05/23
pjd
125
oracle排序效率提升
1、排序字段加索引(优化效果不明显)2、Oracle修改sort_area_size,workarea_size_policy(效果很明显)2.1、 登录dba账号 sqlplus 账号/密码@localhost:1521/数据库名2.2、show parameter sort_area_size; 查看sort_area_size大小默认是65536b(64kb)2....
2024/04/08
pjd
162
Mac电脑本地部署chat-with-mlx
1、安装环境开源地址:https://github.com/qnguyen3/chat-with-mlx准备好miniconda环境,我是从https://docs.anaconda.com/free/miniconda/#latest-miniconda-installer-links 下载安装的pkg安装包。git clone https://github.com/qn...
2024/04/07
pjd
266
Ollama本地部署qwen:32
1、安装Ollama下载地址:www.ollama.com 2、脚本下载模型 ollama run qwen:32b###拉取模型并运行(base) **@~ % ollama run qwen:32bpulling manifestpulling manifestpulling manifestpulling 936798...
2024/04/06
pjd
350
stable diffusion 原理 / latent image 如何理解
Stable Diffusion是一个深度学习模型,用于生成高质量的图像。它结合了多个先进的深度学习技术,包括变分自编码器(VAE)和U-Net。下面分别介绍UNet和VAE的原理,以及它们在Stable Diffusion模型中的作用。U-NetU-Net是一种卷积神经网络(CNN),最初用于医学图像分割任务。它的结构特点是有一个“U”形的对称结构,因此得名U-Net。这种结...
2024/04/06
pjd
243