IT – 既智新闻

周三. 4 月 2nd, 2025

AI生成 IT 机器学习

ML笔记：利用 DeepSeek 的 GPRO 算法优化 LLM 在金融文本和数据预测中的性能

2025年3月20日

1. 引言：LLM 在金融分析与预测中日益增长的作用大型语言模型（LLM）正在金融领域展现出巨大的潜力，其重要性日益凸显。它们…

AI生成机器学习

ML笔记：actual counterfactual prediction 反事实预测为什么重要

2024年9月6日

反事实预测：洞悉因果，驱动决策反事实预测（Counterfactual Prediction）是一种通过模拟“如果……会怎样”…

AI生成机器学习

ML笔记：机器学习中的协变量是什么？

2024年8月28日

在机器学习中，协变量（covariate）是指与研究或建模对象相关的变量，通常作为自变量（特征）用于解释或预测因变量（目标）。协…

AI生成智能新闻机器学习

AI内容农场：垃圾还是宝藏？

2024年8月23日

AI 内容农场：机遇与挑战并存近年来，AI 内容农场泛滥，引发了人们对信息质量和真实性的担忧。然而，从积极的角度来看，AI 技…

IT 机器学习

Cursor 与OpenAI合作的编程工具，集成GPT-4

2024年8月22日

An IDE designed to be your AI pair-programmer. Cursor是一款与OpenAI合…

AI AI生成机器学习

ML笔记：在大语言模型中，监督微调（SFT）和对齐（PPO、DPO）有什么不同的作用？

2024年8月15日

在大语言模型（LLM）中，监督微调（SFT）和对齐（PPO、DPO）是两种不同的技术手段，它们在模型优化和任务适应上有不同的作用…

AI生成机器学习

ML笔记：PyTorch 监控 GPU 内存使用情况

2024年8月13日

torch.cuda.max_memory_reserved() 是 PyTorch 中用于监控 GPU 内存使用情况的一个函数…

AI生成机器学习

ML笔记：alpaca-data-gpt4-chinese数据集是什么？

2024年8月13日

Alpaca-Data-GPT4-Chinese数据集是一个专门为中文语言模型训练而设计的数据集。以下是对该数据集的详细解释和介…

IT 机器学习

ML笔记：什么是组相对策略优化 (GRPO)？

2024年8月11日

什么是组相对策略优化 (GRPO)？ @deepseek_ai Coder v2 是最好的开放代码 LLM，在编码任务中可与 @…

AI生成机器学习

ML笔记：fuggingface datasets 怎么自定义函数筛选数据

2024年8月10日

在 HuggingFace 的 datasets 库中，dataset.map 函数主要用于对数据集中的每个样本应用自定义处理函…

AI生成机器学习

ML笔记：peft库使用qlora微调llm，参数r和lora_alpha的作用和建议的配置值

2024年8月10日

在使用QLoRA算法微调大型语言模型（LLM）时，参数r和lora_alpha起着关键作用。以下是它们的具体作用和建议的配置值：…

AI生成机器学习

ML笔记：使用huggingface 开发的trl库进行大模型微调时，SFTTrainer 怎么配置模型结果保存频次的参数

2024年8月10日

在使用 Hugging Face 开发的 TRL 库进行大模型微调时，可以通过配置 SFTTrainer 的参数来控制模型结果保…

AI生成 IT 机器学习

ML笔记：trl库 SFTTrainer的参数warmup_steps的作用和应该怎么配置

2024年8月10日

warmup_steps 是 SFTTrainer 中的一个重要参数，它的主要作用是控制学习率预热的步骤数。预热步骤的目的是在训…

修改wordpress某主题的摘要字数

2023年8月15日

例如：nano wp-content/themes/newsup/content.php 修改 <p><?ph…

从web2.0 到 web3.0 全览

2022年5月9日

从web2.0 到 web3.0 全览，web3.0可能是外面这一代的新的机会。 Views: 1 … 阅读更多 …

图库

90年代申花出租车司机夜晚在车内看文汇报

黄山的油菜花

90年代的黄河路

shanghai

上海的陆家嘴

上海的陆家嘴

在上海浦东滨江公园观赏外滩建筑群-20240824

上海枫泾古镇一角_20240824

上海宝山炮台湿地公园的蓝天白云

为您推荐

智谱AI Agent：深度研究，操作自如，颠覆未来？

2025年4月2日

吉卜力风网页：Cursor与Claude-3.7共绘梦幻

2025年4月2日

Drinks Industry Bets on the Future at “Coldest in a Decade” Trade Show

2025年4月2日

AI医疗颠覆：OpenEvidence席卷美国医界！

2025年4月2日