Tokens Trade - Search

About 50 results

Open links in new tab

Any time

zhihu.com
https://www.zhihu.com › question
vllm内部怎么根据max_model_len自动计算max_num_batched_tokens？
4. 内存使用效率：模型需要在保证性能的同时，尽量减少内存的使用。 max_num_batched_tokens 的计算可能不是简单的数学公式，而是模型内部通过一系列测试和评估来确定的最佳值。这个值可能会 …
zhihu.com
https://www.zhihu.com › question
使用OpenClaw消耗Tokens非常快怎么办？ - 知乎
使用OpenClaw消耗Tokens非常快怎么办？最近在使用OpenClaw大龙虾，尝试配置了智谱GLM和通义千问Qwen大模型，感觉消耗Tokens比较大，有没有什么安全、可靠、有效的办法可以降低T… 显示全 …
zhihu.com
https://www.zhihu.com › question
NLP领域中的token和tokenization到底指的是什么？ - 知乎
Tokenizer是将文本切分成多个tokens的工具或算法。它负责将原始文本分割成tokens 序列。在NLP中，有多种不同类型的tokenizer，每种tokenizer都有其特定的应用场景和适用范围。基于字符 …
zhihu.com
https://www.zhihu.com › question
ChatGPT如何计算token数？ - 知乎
OpenAI 使用的分词方法，特别是针对汉字，的确有时会导致一个汉字被计算为多个 tokens。这不是将汉字拆成 Unicode 码来处理，而是因为 GPT-3 使用的 Byte-Pair Encoding (BPE) 分词方法会将某些字 …
zhihu.com
https://www.zhihu.com › question
Qwen1.5-72B-Chat-GPTQ-Int4 上下文长度是 32768 tokens 不对吗？
其推理模型QwQ-32B能够高效解决绝大多数场景的推理难题，广泛应用于各类企业级AI解决方案中。 Qwen1.5-72B-Chat-GPTQ-Int4 模型，我输入的prompt_tokens数量远小于支持的最大上下文长度是 …
zhihu.com
https://www.zhihu.com › pin
火山引擎这个月有数据协作计划，每款模型每天送 50 万 tokens | 指 …
第一次开通单个模型会给 50 万 tokens（企业账号 500 万），然后当天使用的 tokens 第二天会返还等额的资源包。模型余量和资源包情况可以在费用中心 - 资源包查看。活动持续到这个月底，如果用于 …
zhihu.com
https://www.zhihu.com › question
阿里云通义千问击穿大模型底价，两百万tokens只需一元，有哪些信息 …
两百万tokens只要一元，我都怀疑电费够不够…. 但上次DeepSeekV2发布后，他们作者说V2那价格还有得赚，那说明模型token的成本最近的确降得很厉害。一方面是英伟达等基础硬件厂商给力，另一方 …
zhihu.com
https://www.zhihu.com › question
大模型的token究竟是什么？ - 知乎
可以说，学习自然语言处理、大模型、Transformer 任何一个技术，都离不开 token这个概念。本专栏就从这个最基础的概念开始讲起。多年前，第一次接触到自然语言处理模型 BERT。当时在评估这个 …
zhihu.com
https://www.zhihu.com › question
deepseek在cherry studio本地知识库会消耗API的tokens吗？
deepseek在cherry studio本地知识库会消耗API的tokens吗？通过cherry studio本地部署，通过API连接（硅基）deepseek，然后建立本立知识库，会不会因为每次调用本地而消耗大量的tokens？我… 显 …
zhihu.com
https://www.zhihu.com › question
硅基流动api连接失败怎么解决？ - 知乎
Feb 13, 2025 · 4. 命名 API Key：在创建 API Key 时，您可能需要为其命名，以便区分不同的 API Key。也可创建后修改其名称 5. 保存 API Key：由于安全原因，请务必妥善保存。请注意，首次注册登录 …

Pagination
- 1
- 2
- 3
- Next