另外以字节内部业务为例,飞书的主要流量高峰在工作时间,抖音在下班后休闲时间的流量更高,这些不同业务的大模型推理,也能根据业务特点错峰使用,就可以降低成本。
谭待进一步解释说,豆包大模型平均每天处理1200亿Tokens文本、生成3000万张图片,这里有不同的负载,可以把不同任务混合在一起,互相错峰,通过智能调度把它们的利用率都跑得很高,就能极大地提升资源利用率,实现整体成本的优化。
对于“大模型开始价格战”的说法,谭待认为,大模型市场仍在发展初期,远远没到激烈竞争的阶段。“池塘有多大,鱼就有多大,现在整个池塘还在培养的过程。”
糖心LOGO入口5月15日,字节跳动豆包大模型在火山引擎原动力大会上正式发布。火山引擎总裁谭待在接受媒体采访时,谈到了大模型的定价策略。
其次是工程上的优化。大模型的调用量越大,优化推理成本的空间也越大。以前的模型都是单机推理,大模型用的是分布式推理。所以如果能把各种各样的底层算力用得更好,推理成本就会大大降低。
豆包大模型的超低价格引发行业震动。据悉,豆包主力模型的推理输入价格只有0.0008元/千Tokens,比行业便宜99.3%。对此,谭待坦言,“降价是用技术优化成本来实现的。如果只是补贴,用亏损换收入是不可持续的,火山引擎不会走这条路。”
963.16MB
查看610.25MB
查看34.2MB
查看344.32MB
查看666.79MB
查看623.75MB
查看668.48MB
查看465.20MB
查看827.31MB
查看190.41MB
查看940.54MB
查看538.93MB
查看936.50MB
查看789.76MB
查看703.53MB
查看594.97MB
查看497.67MB
查看674.49MB
查看648.56MB
查看557.67MB
查看976.39MB
查看667.58MB
查看977.92MB
查看291.65MB
查看788.13MB
查看513.12MB
查看487.70MB
查看383.23MB
查看962.24MB
查看806.73MB
查看510.13MB
查看831.55MB
查看707.30MB
查看588.86MB
查看519.32MB
查看172.67MB
查看711.94MB
查看588.67MB
查看164.70MB
查看242.44MB
查看828.25MB
查看889.20MB
查看946.82MB
查看363.31MB
查看106.15MB
查看278.92MB
查看372.50MB
查看730.27MB
查看253.94MB
查看142.92MB
查看731.53MB
查看765.96MB
查看925.51MB
查看320.63MB
查看909.40MB
查看725.67MB
查看844.24MB
查看566.54MB
查看544.11MB
查看608.91MB
查看830.15MB
查看463.81MB
查看686.78MB
查看333.89MB
查看795.51MB
查看893.55MB
查看412.76MB
查看988.87MB
查看328.72MB
查看278.57MB
查看385.56MB
查看916.39MB
查看264.70MB
查看918.35MB
查看845.27MB
查看382.82MB
查看407.17MB
查看372.71MB
查看490.45MB
查看738.86MB
查看916.24MB
查看905.42MB
查看579.69MB
查看117.97MB
查看109.53MB
查看250.93MB
查看727.97MB
查看728.35MB
查看635.31MB
查看169.93MB
查看798.66MB
查看548.69MB
查看631.65MB
查看727.55MB
查看628.47MB
查看977.27MB
查看799.79MB
查看391.76MB
查看180.56MB
查看124.45MB
查看248.60MB
查看124.89MB
查看240.16MB
查看323.52MB
查看
318 绍兴sz
5月社融平稳增长、信贷投放均衡 金融支持实体经济质效进一步提升✓
2025-06-30 11:30:01 推荐
118 188****4037
淘宝、京东、拼多多...5种赚钱模型,5种赚钱思路✗
2025-06-30 12:06:17 不推荐
413 152****7651
四水干流及湖区水位将上涨✛
2025-06-30 03:07:14 推荐
47 三小只僵尸的游戏时间7
第三批中央企业创新联合体建设启动✞
2025-07-01 0-1:09:45 推荐