background picture of the home page

Hi,Friend

Windows 下 Docker 使用 GPU 运行 vLLM 嵌入式模型

前言 最近需要在本地部署 Qwen3-Embedding-0.6B 模型,利用 vLLM 提供 OpenAI 风格的 Embeddings API。我的电脑是 Windows 系统,显卡为 NVIDIA GTX 1070,打算使用 Docker 容器运行模型以隔离环境。然而,Windows 上的 D

thumbnail of the cover of the post

windows 端口代理

1.powershell # 10809 为vpn的代理端口 # 当前是只有http 和 https 走代理 $env:HTTP_PROXY="http://127.0.0.1:10809" $env:HTTPS_PROXY="http://127.0.0.1:10809" # 所有协议都走代理 $

thumbnail of the cover of the post

Maven命令

1.删除本地某个jar包 mvn dependency:purge-local-repository -DmanualInclude="groupId:artifactId" 2.删除本地jar 并重新下载 mvn dependency:purge-local-repository -Dmanual

thumbnail of the cover of the post

Transformer

Lesson 1:神经网络到底在干什么? 你已经知道 自动求导 和 梯度下降,现在要理解: “为什么多层网络能拟合任何复杂关系?” —— 非线性激活函数 是关键! 如果没有激活函数👇 所有层都是矩阵乘法 🚨 无论堆多少层,本质=线性方程 → 无法拟合复杂关系、对话情绪、人格风格 常见激活函数区别

thumbnail of the cover of the post

Numpy

1.1 创建 ndarray(Numpy 的核心数据结构) Numpy 中所有数据都是 ndarray(n-dimensional array,多维数组)。 是深度学习中所有 Tensor 的原型。 import numpy as np # 从列表创建 a = np.array([1, 2, 3]

thumbnail of the cover of the post