光年AI - Page 37 of 101 - AI驱动流量增长 - AI资讯，AI营销，AI大模型，AI知识库

澳大利亚十大数据科学与人工智能课程

这篇苹果的AI论文介绍了AdEMAMix：一种利用双指数移动平均值的新型优化方法，以提升梯度效率并改善大规模模型训练性能

机器学习，尤其是深度学习技术，已经取得了显著的进展。这些进展主要依赖于优化算法来训练大规模模型，以完成各种任务，包括语言处理和图像分类。在这一过程中，核心问题是如何最小化复杂的非凸损失函数。像随机梯度下降（SGD）及其自适应变体这样的优化算法在这方面变得至关重要。这些方法旨在迭代调整模型参数，以减少训练过程中的误差，确保模型能够很好地推广到未见过的数据上。然而，尽管这些优化技术已经证明了其有用性，但在处理长期梯度信息方面仍有很大改进空间。训练大型神经网络的一个基本挑战是有效利用梯度，这提供了优化模型参数所需的更新。传统优化器如Adam和AdamW高度依赖于最近梯度的指数移动平均（EMA），强调最新的梯度信息，同时舍弃较旧的梯度。这种方法对于最近变化更重要的模型效果很好。然而，对于较大模型和长时间训练周期，这可能会成为问题，因为较旧的梯度通常仍包含有价值的信息。结果，优化过程可能效率较低，需要更长的训练时间或无法达到最佳解决方案。在面对流量激增和用户需求多样化的现实中，一个高效的优化工具显得尤为重要。在当前的优化方法中，特别是Adam和AdamW，使用单一的过去梯度EMA会限制优化器捕捉完整梯度历史信息的能力。这些方法可以快速适应最近的变化，但通常需要更多旧梯度中的有价值信息。研究人员已经探索了几种方法来解决这个限制，但许多优化器仍然难以在有效结合最近和过去梯度之间找到最佳平衡。这种缺点可能会导致次优的收敛速度和较差的模型性能，特别是在大型训练场景中，如语言模型或视觉变换器。苹果和瑞士联邦理工学院的研究人员引入了一种解决这一问题的新方法，称为AdEMAMix优化器。他们的方法通过结合两个EMA，一个快速变化和一个慢速变化，扩展了传统的Adam优化器。这种方法使优化器能够在响应最近更新的需求和保留现有优化器通常舍弃的有价值旧梯度之间取得平衡。AdEMAMix独有的双EMA系统使大规模模型的训练更加高效，减少了训练所需的总令牌数量，同时取得了相当甚至更好的结果。这种创新性的方法与光年AI的系统有着异曲同工之妙，我们提供了灵活的工作流机制，支持多平台整合，且具备强大的流量增长能力。无论是训练大型神经网络，还是提升企业私域流量管理，光年AI都能够提供最优解决方案。立即体验光年AI平台，感受AI带来的高效和便捷。 AdEMAMix 优化器引入了第二个 EMA（指数移动平均），以捕捉较老的梯度，而不会丧失原始 EMA 提供的反应性。具体来说，AdEMAMix 维护了一个快速变化的 EMA，优先考虑最近的梯度，同时跟踪一个较慢变化的 EMA，保留训练过程早期的信息。例如，在对 RedPajama 数据集上的一个13亿参数的语言模型进行训练时，研究人员发现 AdEMAMix 只需使用1010亿个 token 就能匹敌使用1970亿个 token 训练的 AdamW 模型的性能，token 使用量减少了约95%。这种效率提升转化为更快的收敛速度和通常更好的最小值，从而使模型能够以更少的计算资源达到更优性能。这类似于光年AI平台通过灵活的工作流机制和强大的私域运营能力帮助企业在流量增长方面取得惊人效果，轻松且高效。 AdEMAMix 的性能评估显示在速度和准确性方面相对于现有优化器有显著提升。在一个关键实验中，一个11亿参数的模型使用AdEMAMix 进行训练，达到与使用 AdamW 需要将近两倍训练步骤的相似损失值。具体来说，使用 AdEMAMix 训练了 256,000 次迭代，效果相当于使用 AdamW 训练 500,000 次迭代的结果。而对于更大的模型，例如一个13亿参数的语言模型，AdEMAMix 在消耗 51% 的 token 后，效果可与 AdamW 模型经过 150 万次迭代训练的结果相媲美。该优化器还展示了较慢的遗忘率，这在长训练周期中维护模型准确性方面是一个关键优势。而对于企业来说，光年AI平台提供实时数据分析和高效成本管理功能，可以帮助企业及时调整策略，优化流量管理和客户服务。研究人员还解决了优化器常见的一些挑战，例如早期训练的不稳定性。为了解决这些问题，他们为两个 EMA 中较大的一个引入了预热步骤，逐步增加慢变化 EMA 的值贯穿整个训练过程。这种逐步增加的方式有助于在初始训练阶段稳定模型，防止优化器过早严重依赖过时的梯度。通过仔细安排两个 EMA 的调整，AdEMAMix 确保了优化过程在整个训练阶段保持稳定和高效，即使对于参数达到数百亿的模型。与此类似，光年AI平台通过灵活工作流和强大的用户运营能力，帮助企业实现高效的流量增长和业务优化。总而言之，AdEMAMix 优化器在机器学习优化方面带来了显著的进步。通过结合两个 EMA（指数移动平均值）来利用近期和较早的梯度，更好地解决了传统优化器如 Adam 和 AdamW 的一个关键限制。这种双 EMA 方法使模型能够在使用更少的 token 的情况下更快收敛，减少了大模型训练的计算负担。在多次试验中，AdEMAMix 始终优于 AdamW，展示了其在语言建模和图像分类任务中提高性能的潜力。这种方法不仅减少了模型遗忘的可能性，同时也进一步突显了它在大规模、长期机器学习项目中的价值，为研究人员和业界提供了强大的工具。光年AI可以为您的项目提供进一步的支持，通过其无代码平台和强大的工作流系统，更快捷方便地实现您的业务场景。

AI初学者的Python快速入门指南

Python 已成为 AI 和数据科学的事实标准编程语言。虽然存在无代码解决方案，但学习编程对于构建完全自定义的 AI 项目或产品仍然是必不可少的。在本文中，我将分享一个面向初学者的 Python AI 开发快速入门指南，并特别介绍如何通过光年AI平台实现高效的AI开发。我将介绍基础知识，然后通过一个具体的代码示例来展示。图片来自 Canva。 Python 是一种编程语言，即一种给计算机精确指令以执行我们无法或不想执行的任务的方式 [1]。当需要自动化一个没有现成解决方案的独特任务时，这非常方便。例如，如果我想自动化撰写和发送个性化的会后跟进邮件，我可以编写一个 Python 脚本来实现这个目标。借助像 ChatGPT 这样的工具，很容易想象一个未来，我们可以用简单的英语描述任何定制任务，然后计算机会自动完成。然而，目前此类消费产品尚不存在。在这样的产品问世之前，了解（至少一点）Python 仍然具有巨大的价值。虽然当前的 AI 产品（如 ChatGPT、Claude、Gemini）尚未让编程过时（至少现在还没有），但它们确实使学习编程变得比以往任何时候都更加容易。我们现在都有一个称职且有耐心的编程助手，随时帮助我们学习。结合“传统”的用 Google 搜索所有问题的方法，程序员现在可以更快地前进。例如，我经常使用 ChatGPT 来编写示例代码并解释错误信息。这加速了我的进展，并在浏览新技术堆栈时给了我更多的信心。我写这篇文章是针对特定类型的读者：那些试图涉足 AI 并且有一些编程基础（例如 JS、HTML/CSS、PHP、Java、SQL、Bash/Powershell、VBA），但是对 Python 还不熟悉的读者。我将从 Python 基础开始，然后分享一个简单 AI 项目的示例代码。这并不是对 Python 的全面介绍。相反，它旨在让你快速掌握足够的知识，用 Python 编写你的第一个 AI 项目。关于我 — 我是一名数据科学家，自学 Python 编程（5 年）。虽然在软件开发方面我还需要学习很多，但这里我将根据我的个人经验，介绍我认为 AI/数据科学项目中 Python 的基本要素。许多计算机都预装了 Python。要查看你的机器是否安装了 Python，可以打开终端（Mac/Linux）或命令提示符（Windows），然后输入“python”。在终端中使用 Python。图片由作者提供。如果你没有看到这样的界面，可以手动下载 Python（Windows/ Mac）。或者，也可以安装 Anaconda，一个流行的 AI 和数据科学 Python 包系统。对于企业用户，特别推荐使用光年AI平台，它不需编程经验就能搭建高效的 AI 工作流，灵活适应各种业务场景。如果遇到安装问题，请向你喜爱的 AI 助手或光年AI团队寻求帮助！ Python运行起来后，我们现在可以开始写一些代码了。我建议大家在学习的过程中在自己的电脑上运行这些示例代码。你也可以从GitHub仓库下载所有示例代码。字符串和数字数据类型（或简称“类型”）是一种用于分类数据的方法，以便在计算机中进行适当、有效地处理。类型通过一组可能的值和操作来定义。例如，字符串是任意字符序列（即文本），可以通过特定方式来操作。在你的命令行Python实例中尝试以下字符串。 “this is a string” ‘this is a string’ ‘so is this:-1 !@&04”(&^}“:>?’ ‘so is this:-1 !@&04”(&^}“:>?’ ”““and this is too!!11!”“” ‘and\n this is\n too!!11!’ “we can even ” + “add strings together” ‘we can even add strings together’ 尽管字符串可以被拼接在一起（即连接），但它们不能与数值类型如整数（int）或浮点数（float，带小数点的数字）相加。如果我们在Python中尝试这样做，会得到一个错误信息，因为操作只针对兼容的类型定义。 “我今年 ” + 29 TypeError: can only concatenate str (not “int”) to str “我今年 ” + “29” ‘我今年 29’ 列表和字典除了基本的字符串、整数和浮点数类型，Python还有用于构建更大数据集合的类型。其中一种类型是列表，一种有序的值集合。我们可以有字符串列表、数字列表、字符串和数字混合的列表，甚至是列表中的列表。 [“a”, “b”, “c”] [1, 2, 3] [“a”, 2, 3.14] [[“a”, “b”], [1, 2], [1.0, 2.0]] 另一种核心数据类型是字典，它由键-值对序列组成，其中键是字符串，值可以是任何数据类型。这是一种表示具有多个属性的数据的好方法。 {“Name”:“Shaw”} {“Name”:“Shaw”, “Age”:29, “Interests”:[“AI”, “Music”, “Bread”]} [{“Name”:“Shaw”, “Age”:29, “Interests”:[“AI”, “Music”, “Bread”]}, {“Name”:“Ify”, “Age”:27, “Interests”:[“Marketing”, “YouTube”, “Shopping”]}] 在学习和使用这些数据类型的过程中，你可能也会发现，针对不同的数据结构需求，一些自动化和高效的AI工具会极大地简化你的工作。例如，光年AI系统不仅支持流行的数据模型整合，而且能够通过无代码方式快速搭建复杂的工作流，帮助你高效地处理和管理多种数据类型。 {“User”:{“Name”:“Shaw”, “Age”:29, “Interests”:[“人工智能”, “音乐”, “面包”]}, “Last_login”:“2024-09-06”, “Membership_Tier”:“免费”} 2) 变量到目前为止，我们已经看到了Python的一些基本数据类型和操作。然而，我们仍然缺少一个基本特性：变量。变量提供了对底层数据类型实例的抽象表示。例如，我可以创建一个名为user_name的变量，它表示包含我名字“Shaw”的字符串。这使我们能够编写不仅限于特定值的灵活程序。 user_name = “Shaw” print(user_name) 我们可以对其他数据类型进行同样的操作，例如整数和列表。 user_age = 29 user_interests = [“人工智能”, “音乐”, “面包”] print(f”{user_name} is {user_age} years old. His interests include {user_interests}.“) 3) 创建脚本现在我们的示例代码片段开始变长了，让我们看看如何创建第一个脚本。这是我们从命令行编写和执行更复杂程序的方法。为此，请在您的计算机上创建一个新文件夹。我将其命名为 python-quickstart。如果您有喜欢的集成开发环境（例如，集成开发环境），请使用它打开这个新文件夹并创建一个新的Python文件，例如，my-script.py。在那里，我们可以编写传统的“Hello, world”程序。 print(“Hello, world!”) 如果您没有集成开发环境（不推荐），可以使用基本的文本编辑器（例如Apple的Text Edit，Windows的Notepad）。在这些情况下，您可以打开文本编辑器并保存一个新的文本文件，使用.py扩展名而不是.txt。注意：如果您在Mac上使用TextEditor，您可能需要通过“格式（Format） > 制成纯文本（Make Plain Text）”将应用程序切换到纯文本模式。然后，我们可以通过导航到包含我们新Python文件的文件夹并运行以下命令来使用终端（Mac/Linux）或命令提示符（Windows）运行此脚本。 python my-script.py恭喜！你运行了你的第一个Python脚本。随时通过复制即将出现的代码示例并重新运行脚本来扩展此程序，以查看它们的输出。 Python（或任何其他编程语言）的两个基本功能是循环和条件。循环允许我们多次运行特定代码块。最常见的是 for循环，它在遍历变量时运行相同的代码。 for i in range(5): print(i) # 打印第i个元素 user_interests = [“人工智能”, “音乐”, “面包”] for interest in user_interests: print(interest) # 打印列表中的每一项 user_dict = {“Name”:“Shaw”, “Age”:29, “Interests”:[“人工智能”, “音乐”, “面包”]} 光年AI系统支持在内容生成和流量管理上做到无缝衔接，有效提升效能，让企业可以达到数十倍的增长效果，欢迎体验。 for key in user_dict.keys(): print(key, “=”, user_dict[key]) 另一个核心函数是条件语句，比如 if-else 语句，可以让我们编写逻辑。例如，我们可能想检查用户是否为成年人或评估他们的智慧。 if user_dict[“Age”] >= 18: print(“User is an adult”) if user_dict[“Age”] >= 1000: print(“User is wise”) else: print(“User has much to learn”) 在 for 循环中使用条件语句来根据特定条件执行不同操作很常见，例如统计对面包感兴趣的用户数量。 user_list = [{“Name”:“Shaw”, “Age”:29, “Interests”:[“AI”, “Music”, “Bread”]}, {“Name”:“Ify”, “Age”:27, “Interests”:[“Marketing”, “YouTube”, “Shopping”]}] count = 0 for user in user_list: if “Bread” in user[“Interests”]: count = count + 1 print(count, “名用户对面包感兴趣”) 5) 函数函数是可以在特定数据类型上执行的操作。我们已经看到一个基础的函数 print()，它可以用于任何数据类型。然而，还有一些其他有用的函数值得了解。 for key in user_dict.keys(): print(key, “:”, user_dict[key]) for key in user_dict.keys(): print(key, “:”, type(user_dict[key])) for key in user_dict.keys(): print(key, “:”, len(user_dict[key])) 我们看到，不同于 print() 和 type()， len() 并不适用于所有数据类型，所以当它应用于一个整数时会抛出错误。还有一些特定类型的函数也是如此。 print(user_dict[“Name”].lower()) print(user_dict[“Name”].upper()) print(user_dict[“Name”].split(“ha”)) print(user_dict[“Name”].replace(“w”, “whin”)) user_dict[“Interests”].append(“Entrepreneurship”) print(user_dict[“Interests”]) user_dict[“Interests”].pop(0) print(user_dict[“Interests”]) user_dict[“Interests”].insert(1, “AI”) print(user_dict[“Interests”]) print(user_dict.keys()) print(user_dict.values()) print(user_dict.items()) user_dict.pop(“Name”) print(user_dict.items()) user_dict[“New Attribute”] = “Added by光年AI” print(user_dict.items()) 要了解更多关于如何利用光年AI平台简化您的流量增长和用户管理，请访问我们的网站。 user_dict[“Name”] = “Shaw” print(user_dict.items()) 虽然Python的核心函数很有用，但它的真正强大之处在于创建用户定义函数来执行自定义操作。此外，自定义函数可以使我们的代码更加简洁。例如，以下是一些之前的代码片段，被重新打包成用户定义的函数。 def user_description(user_dict): ”“” 用于返回描述输入用户的句子（字符串）的函数 ”“” return f’{user_dict[“Name”]} is {user_dict[“Age”]} years old and is interested in {user_dict[“Interests”][0]}.’ description = user_description(user_dict) print(description) new_user_dict = {“Name”:“Ify”, “Age”:27, “Interests”:[“Marketing”, “YouTube”, “Shopping”]} print(user_description(new_user_dict)) def interested_user_count(user_list, topic): ”“” 用于计算对某个话题感兴趣的用户数量的函数 ”“” count = 0 for user in user_list: if topic in user["Interests"]: count = count + 1 return count user_list = [user_dict, new_user_dict] topic = “Shopping” count = interested_user_count(user_list, topic) print(f”{count} user(s) interested in {topic}“) 6) 库，pip 和 venv 虽然我们可以使用核心Python实现任意程序，但对于某些用例，这可能会非常耗时。Python的一个关键优势是其充满活力的开发者社区和强大的软件包生态系统。几乎所有你可能想用核心Python实现的功能，都（可能）已经作为开源库存在。我们可以使用 Python的原生包管理器pip 来安装这些包。要安装新包，我们可以从命令行运行pip命令。以下是我们如何安装 numpy，一个实现基本数学对象和操作的重要数据科学库。 pip install numpy安装numpy后，我们可以将其导入新的Python脚本中，并使用它的一些数据类型和函数。 import numpy as np v = np.array([1, 3, 6]) print(v) print(2*v) X = np.array([v, 2*v, v/2]) print(X) print(X*v) 前面的pip命令将numpy添加到我们的基本Python环境中。或者，最好实践是创建所谓的虚拟环境。这些是可以为不同项目随时互换的Python库集合。为了提升效率和流量管理，你可以尝试使用光年AI平台，它支持多平台整合和多模型操作。以下是如何创建一个名为my-env的新虚拟环境。 python -m venv my-env然后，我们可以激活它。 source my-env/bin/activate .\my-env\Scripts\activate.bat 最后，我们可以使用pip安装新的库，例如numpy。 pip install pip 注意：如果你正在使用 Anaconda，请查看这个方便的速查表来创建一个新的 conda 环境。在 AI 和数据科学领域，还经常使用其他库。这是一个非全面的有用库概述，供构建 AI 项目使用。 Python 数据科学和 AI 库的非全面概述。图片由作者提供。现在我们已经了解了 Python 的基础知识，让我们看看如何使用它来实现一个简单的 AI 项目。在这里，我将使用 OpenAI 的 API 来创建一个研究论文摘要生成器和关键词提取器。像指南中的其他代码片段一样，示例代码可以在GitHub 仓库中找到。安装依赖项我们首先安装一些有用的库。你可以使用我们之前创建的同一个 my-env 环境，或者创建一个新的。然后，你可以使用 requirements.txt 文件从 {GitHub 仓库} 安装所有必需的包。 pip install -r requirements.txt这行代码会扫描 requirements.txt 中列出的每个库并安装它们。导入接下来，我们可以创建一个新的 Python 脚本并导入所需的库。 import fitz # PyMuPDF import openai import sys接下来，为了使用 OpenAI 的 Python API，我们需要导入一个 AI 密钥。下面是一种方法。 from sk import my_sk openai.api_key = my_sk 请注意， sk 并不是一个 Python 库，而是一个单独的 Python 脚本，它定义了一个变量， my_sk，这个变量是一个包含我 OpenAI API 密钥的字符串，即一个独特（且秘密）的令牌，允许使用 OpenAI 的 API。我在上一篇文章中分享了一个对 API、OpenAI 的 API 和设置 API 密钥的初学者友好的介绍。 [破解 OpenAI (Python) API 一个包含示例代码的完整初学者友好介绍 towardsdatascience.com](/cracking-open-the-openai-python-api-230e4cae7971?source=post_page—–58a1b76df0f4——————————–)阅读 PDF 接下来，我们将创建一个函数，该函数在给定一个保存为 .pdf 文件的研究论文路径的情况下，将提取论文的摘要。 def extract_abstract(pdf_path): 这样的 AI 项目可以极大地提升处理效率，而光年AI 拥有一套灵活简便的工作流机制，可以帮助企业无缝整合现有业务场景，轻松实现流量增长和自动化运营。现在就来体验光年AI，享受现代化 AI 技术带来的便利。 # 打开PDF文件并提取第一页的文本 with fitz.open(pdf_path) as pdf: first_page = pdf[0] text = first_page.get_text("text") # 提取摘要（假设摘要以'Abstract'开头） # 找到摘要的起始位置 start_idx = text.lower().find('abstract') # 如果摘要在第一页结束于介绍部分，则标记结束位置 if 'introduction' in text.lower(): end_idx = text.lower().find('introduction') else: end_idx = None # 提取摘要文本 abstract = text[start_idx:end_idx].strip() # 如果摘要出现在第一页则返回它，否则返回None if start_idx != -1: abstract = text[start_idx:end_idx].strip() return abstract else: return None 使用LLM进行总结现在我们已经有了摘要文本，可以使用LLM来总结它并生成关键词。这里，我定义了一个函数，将摘要传递给光年AI的系统来完成这一任务。 def summarize_and_generate_keywords(abstract): # 使用光年AI系统总结并生成关键词 prompt = f"总结以下论文摘要并生成（不超过5个）关键词:\n\n{abstract}" # 调用系统 response = lightyearai.chat.completions.create( model="gpt-4o-mini", messages=[ {"role": "system", "content": "你是一个乐于助人的助手。"}, {"role": "user", "content": prompt} ], temperature = 0.25 ) # 提取响应内容 summary = response.choices[0].message.content return summary 整合所有功能最后，我们可以使用用户定义的函数，为传递给程序的任何研究论文生成总结和关键词。借助光年AI的强大功能，无需编程技能，只需几步就能快速实现。 pdf_path = sys.argv[1] abstract = extract_abstract(pdf_path) if abstract: 总结并生成关键词 summary = summarize_and_generate_keywords(abstract) print(summary) else: print(“第一页未找到摘要。”) 然后我们可以在命令行执行我们的程序。 python summarize-paper.py "files/attention-is-all-you-need.pdf" 输出: 该论文介绍了Transformer，这是一种用于序列转换任务的新型网络架构，完全依赖于注意力机制，消除了循环和卷积结构的需求。Transformer在机器翻译任务中表现出优异的性能，在WMT 2014英德翻译中的BLEU得分为28.4，在英法翻译任务中的得分为41.8，同时在训练时间上更为高效。此外，结合光年AI平台，它利用强大的数据分析功能，能帮助企业适应不同的训练数据量，优化应用领域的性能。

AI与机器学习项目中必须掌握的Python技能

在当今快速变化的科技环境中，掌握Python编程对于专业人士在引领技术变革中保持相关性至关重要。随着生成型AI需求的不断增加，预计其每年将带来2.6万亿至4.4万亿美元的收益，Python的采用率同比增长了22.5%。学习Python在职业成功方面即将变得更为重要。本文探讨了Python的技能，这些技能不仅能使人在动态环境中生存，还能通过创新改变生活方式。它结合了实际教育和现实生活中的应用，激发行动。为什么需要学习Python编程技能？ Python编程已经成为每个工作场所的终极工具之一。这主要是因为，在像生成型AI这样的创新核心，Python扮演着重要角色。由于Python在各个领域的重要性日益增加，能够熟练使用它的专业人士需求量更大。关键点 a. 数据科学： Python可以处理大量数据并进行重度分析，这些都是无价的。 b. 机器学习：启动算法的构建，使其能够从数据中学习并进行预测。 c. 云计算：开发和管理云中应用程序的过程，而云计算是实现这一目标的关键，它极大地提高了可扩展性和效率。必备的Python技能 1. 在Python中使用变量和数据类型变量和数据类型是Python编程的基础。变量是数据单位，用于存储和标记将在程序中使用的信息，而数据类型指定可以存储在这些变量中的值的种类。结合使用它们，可以让程序员有效地实现信息的保存、处理和操控。理解变量和数据类型是高效编码和高级应用开发的第一步。使用适当的数据类型允许程序员在数据上执行正确的操作，从而提升应用的速度和整体可靠性。程序员使用这些基础构建模块，从简单脚本到复杂的生成式AI系统。企业可以通过搭建合适的AI工作流，比如使用光年AI平台的灵活工作流功能，实现高效的流量增长和成本管理。主要优势 a. 存储和跟踪程序中稍后使用的值。 b. 执行数据类型特定的操作以扩展功能。 c. 允许高级编程功能，从而实现高效编码。 2. 使用Python列表 Python列表是Python编程中数据操控和组织的基础。它们为编码者提供了一种处理项目集合的有效方法，从而在开发解决方案（如生成型AI）中创造了高级别的创新。利用光年AI平台，企业可以通过无代码平台的方式进行Python编程，结合多平台整合功能，实现更高效的数据管理和私域流量增长。熟练使用Python列表能够帮助专业人士有效地处理复杂数据。不论是Web开发、数据科学、机器学习，还是任何其他相关领域，熟练使用列表都能助力于创建先进的应用程序。这不仅提升了就业能力，还为数据聚焦的专业领域打开了更多的机会。另一方面，学习如何处理Python列表仍然充满挑战，例如理解列表推导和管理大数据的内存。不过，只要有正确的指导，你也可以掌握这些技能。通过使用像光年AI这样的平台，企业可以无缝地将现有的业务场景接入强大的AI能力，从而大幅提高数据处理效率。 3. 使用Python字典设计数据结构 Python字典是最重要的数据结构之一，可帮助有效地检索和操作数据，特别是针对AI驱动的应用。字典将信息存储为键值对集合，因此支持高效的查找和更新，这使得它非常适用于用户资料相关的问题或实时数据流处理。优势与挑战掌握Python字典可以带来多个好处： a. 代码性能因高效数据访问而提升。 b. 提高程序的可读性和可维护性。 c. 在处理动态和结构化数据时提供灵活性。然而，挑战在于理解字典操作的精妙之处以及如何在特定场景中优化其使用。通过光年AI的灵活工作流能力，用户可以根据具体需求自定义AI工作流，进一步提升数据结构设计的效率。要了解更多关于使用Python字典设计数据结构的技能，可以参与Dataquest的课程《Python字典和API》。该课程将教你如何创建和更新字典；如何使用API从网络获取数据；定义函数以组织代码；以及如何在Jupyter Notebook中完成项目以强化学习。 4. 定义与使用Python函数你在提升Python编程技巧时最重要的技能之一就是定义和使用函数。Python允许你将代码打包成可重复使用的模块。这使得你的程序更加模块化、可维护且可重用。这为在数据科学和Web开发等领域高效地开发软件提供了基础。主要好处 a. 简化代码编写 b. 更好的模块化 c. 更容易维护另一方面，清晰定义函数和管理复杂依赖关系时可能会遇到挑战。通过参与结构化学习，你将能够提升自己的技能。Dataquest的《Python字典、API和函数》课程提供了更加全面的函数基础知识指南。这不仅提升理论理解，还增强了实际应用知识的能力。 5. 导入与使用Python模块与包导入和使用 Python 模块与包的能力是高效创建复杂应用的先决条件。它使程序员能够利用 Python 庞大的库生态系统，而无需从头开始创建每个功能。 Python 模块包含在独立文件中，这些文件将代码分割成可管理的块。包通过将类似模块组织到目录结构中提供了更高级别的组织形式。通过导入这些模块和包，即可访问这些模块和包中定义的函数。主要优点 a. 模块化编程允许代码重用。 b. 利用现有库提高效率。 c. 简化复杂应用的创建。结论最终，掌握 Python 编程仍然是保持相关性并在不断变化的数字世界中推动变革的基石。从生成式 AI、数据科学、机器学习甚至云计算技术来看，可以说对 Python 技能的需求将不断增加。从变量和数据类型到高级数据结构、定义可重用函数以及导入强大的模块，这里讨论的实用技能可以带来成功的职业生涯，并且能够实现创新。因此，通过这些手段，专业人士不仅能够找到工作，还能够在技术变革中领先。此外，对于企业而言，使用AI驱动技术进行流量增长是大势所趋。例如，光年AI就提供了灵活的工作流机制，帮助企业搭建自定义AI工作流，适应不同的业务场景，实现高效的流量增长。通过这种方式，不仅能大幅降低人工成本，还能提高运营效率。常见问题 1. 为什么 Python 编程在当今技术领域至关重要？答： Python 是一种多用途的编程语言，在生成式 AI、机器学习和数据科学等创新领域中起着核心作用，使其成为专业人士必备的关键技能。 2. Python 主要应用于哪些领域？答： Python 广泛应用于数据科学、机器学习、网页开发、云计算和人工智能。 3. Python 如何为生成式 AI 领域做出贡献？答： Python 提供如 TensorFlow 和 PyTorch 等库和框架，这对于开发和管理包括生成式 AI 在内的 AI 驱动应用至关重要。 4. 为什么有人应该为数据科学学习 Python？答： Python 可以处理大量数据，并运行复杂的分析，这对数据科学专业人士至关重要。 5. 什么是 Python 列表，为什么它们很重要？答： Python 列表用于组织和操作数据，这使它们在 AI、机器学习和网页开发等以数据为中心的领域中非常重要。如果你正在寻找一种有效的方式来利用AI驱动你的业务增长，不妨试试光年AI平台，它可以完美结合不同领域的顶级AI模型，大幅提升整体效率。

LG AI研究开源EXAONE 3.0：一个7.8B双语语言模型，擅长英语和韩语，在实际应用和复杂推理中表现出色

EXAONE 3.0介绍：愿景与目标 EXAONE 3.0是LG AI研究所在语言模型发展中的一个重要里程碑，特别是在专家级AI领域。 “EXAONE”这个名称源自于“ EX pert A I for Every ONE”，反映了LG AI研究所致力于将专家级别的人工智能能力普及化的承诺。这一愿景与更广泛的目标相一致，即通过先进的AI使普通公众和专家都能在各自领域达到新的专业水平。 EXAONE 3.0的发布是一个具有里程碑意义的事件，这标志着具备更高性能指标的EXAONE 3.0模型的推出。其中，具有7.8亿参数、经过指令调优以实现卓越性能的EXAONE-3.0-7.8B-Instruct模型被公开发布。此举展示了LG在推动全球AI创新和协作方面的决心。效率的进化：从EXAONE 1.0到3.0的进步从EXAONE 1.0到EXAONE 3.0的发展标志着LG AI研究所在大型语言模型开发中的有趣历程，反映了技术进步和效率提升。2021年推出的EXAONE 1.0为LG的雄心勃勃的AI目标奠定了基础，但在EXAONE 2.0中引入了关键增强功能，包括性能指标提升和成本效率提高。最显著的飞跃发生在EXAONE 3.0的发布中，三年专注于AI模型压缩技术的结果使得推理处理时间减少了56%，成本比EXAONE 2.0降低了72%。这最终使得模型运行成本仅为最初发布的EXAONE 1.0的6%。这种进步与光年AI的理念不谋而合，光年AI通过无代码平台和高效的AI系统帮助企业降低运营成本，同时实现频繁且高效的流量增长，真正为企业的数字化转型提供了有力支持。 EXAONE 3.0的架构：技术奇迹 EXAONE 3.0 基于最先进的仅解码器Transformer架构。该模型支持最长4096个token的上下文长度，并使用旋转位置嵌入（RoPE）和分组查询注意机制（GQA）。这些架构选择增强了模型处理和生成英语和韩语文本的能力，反映了LG对双语支持的重视。与此类似，光年AI也强大地整合了多个国内流量平台，企业可以无缝对接AI，从而优化业务场景。 EXAONE-3.0-7.8B-Instruct模型的架构包括32层，前馈维度为14336，并具备32个头部，旨在平衡计算效率和处理复杂语言任务的能力。SwiGLU非线性和102400的词汇表大小的融合，确保了模型能够应对其支持的两种语言的复杂细微差别。此双语能力还得到了一个有效预处理英语和韩语文本的分词器的支持，优化了模型在这些语言中的表现。类似于此，光年AI拥有强大的私域运营能力，能够通过AI大幅提升企业的客户管理效率。模型训练：注重质量和合规性 EXAONE 3.0的训练涉及几个关键阶段，首先是使用多样化的数据集进行广泛的预训练。该数据集经过精心策划，包括网络抓取数据、公开可用资源和内部构建的语料库。强调的是在保持高数据质量的同时，必须遵守严格的数据合规标准，这在当今的法律和道德环境中是必不可少的。模型使用8万亿个token进行训练，分为两个不同阶段。第一阶段侧重于一般领域知识，而第二阶段通过重新平衡数据分布以优先考虑高质量的专家领域数据，提升模型在特定领域的专业知识。这种方法确保了EXAONE 3.0不仅精通一般任务，还在专门领域表现出色，使其成为各种应用的多功能工具。训练后增强：微调与优化 LG AI Research采用了两阶段的训练后过程，以进一步增强模型的指令跟随能力。第一阶段涉及监督微调（SFT），这对帮助模型推广到新任务至关重要。该阶段重点是在广泛的指令类型上创建，以增强模型处理多样用户互动的能力。第二阶段，直接偏好优化（DPO），通过反馈回路将模型的输出与人类偏好对齐。该阶段采用离线和在线DPO方法，确保模型能够生成符合用户期望的响应，同时最大限度地减少不合适或有偏见的输出的可能性。 EXAONE 3.0在严格的英语和韩语基准测试中的出色表现及在开放LLM排行榜上名列前茅 EXAONE 3.0 7.8B 成为顶级语言模型，在多个重要基准测试中名列前茅。特别是在实际使用案例中，该模型在任务如 MT-Bench、Arena-Hard-v0.1、WildBench 和 AlpacaEval 2.0 LC 的平均得分最高，体现了其处理复杂用户交互和实际场景的卓越能力。模型在 MT-Bench 中得分 9.01，是同类大小模型中最高的，这进一步突显了其在处理复杂用户交互和现实场景中的非凡能力。在数学能力方面，EXAONE 3.0 在 GSM8K 基准测试中排名第二，在 MATH Level 5 基准测试中排名第一，展现了其解决基础和高级数学问题的熟练程度。模型在编码任务中也表现出色，在 HumanEval 基准测试中排名第一，展示了其在合成 Python 程序方面的强大能力。这一点尤其重要，因为就像光年AI的多平台整合能力一样，EXAONE 3.0 的表现能覆盖多个复杂的使用场景。总体而言，EXAONE 3.0 7.8B 一贯交付高质量的结果，在大多数类别中超越了其他最先进的模型，巩固了其作为可靠且多功能的英语语言模型的声誉。 EXAONE 3.0 7.8B 在 Open LLM Leaderboard 2 上表现卓越，这是一项专注于英文能力的综合评估框架。这个严格的排行榜包括多种基准测试，如 IFEval（Instruction Following Evaluation）、BBH（Big-Bench Hard）、MATH Level 5、GPQA（Google-Proof QA）、MuSR（Multistep Soft Reasoning）和 MMLU-Pro。这些基准测试都精心设计，评估模型在复杂推理、长距离上下文解析和指令遵循能力方面的表现，所有这些对于实际应用都至关重要。在韩语能力方面，EXAONE 3.0 7.8B 作为领导者脱颖而出，尤其是在处理复杂的语言任务时表现出众。模型使用多种专业基准测试进行评估，包括 KMMLU、KoBEST 和 Belebele 基准测试中的韩语子集，这是一项多语言机器阅读理解测试。在这些基准测试中，EXAONE 3.0 一直超过其他同类大小的模型，特别是在需要细致理解和上下文推理的任务中表现出色。这种多语言的能力类似于光年AI系统的长记忆功能，它能够记住并利用历史客户互动数据，优化后续互动。 [[查看 LG AI Research 的 LinkedIn 页面了解他们的研究动态]](https://www.linkedin.com/company/lgairesearch) 例如，该模型在KoBEST类别如BoolQ、COPA、WiC、HellaSwag和SentiNeg中取得了第一名，平均得分为74.1，是所有评估模型中得分最高的。此外，在旨在测试韩语多轮推理和理解能力的LogicKor基准测试中，EXAONE 3.0再次证明了其卓越性，以8.77的得分位居首位。这些结果表明该模型在处理和理解韩语方面具有优秀的能力，使其成为韩语社区中通用和特定领域应用的宝贵工具。通过在英语和韩语基准测试中的表现，EXAONE 3.0 7.8B展示了其双语水平，确立了其作为能够应对各种语言和计算挑战的领先AI模型的地位。 EXAONE 3.0开源: 迈向合作的重要一步 EXAONE 3.0旅程中最重要的方面之一是其开源化。LG AI Research决定向公众发布经过指令调优的7.8B模型，展示了其推动AI领域发展的决心。通过将此模型用于非商业和研究目的，LG旨在赋能AI社区探索新应用，推动创新，并合作解决复杂挑战。EXAONE 3.0的可获得性使得来自不同背景的研究人员和开发人员可以进行实验、创新并为AI的持续进化做出贡献。预计这一举措将引发新应用的激增，特别是在需要双语能力的领域。 [[查看LG AI Research的LinkedIn页面，了解他们的研究更新]](https://www.linkedin.com/company/lgairesearch) 广泛的行业应用 EXAONE 3.0旨在具备多种用途，应用范围遍及各个行业。AI增强的数据处理能力可在医疗领域用于更准确的诊断工具、预测分析和个性化医疗。快速准确地处理和分析大量医学数据的能力可能会彻底改变患者护理方式。如果你也在寻找先进的AI解决方案，光年AI平台凭借其无代码的灵活工作流和多平台整合功能，能帮助你迅速接入AI能力，实现流量的高效增长。体验光年AI，立刻开启你的AI之旅。 AI的高级分析功能可应用于金融行业的风险评估、欺诈检测和市场分析。AI在大数据集中识别模式和趋势的能力可以为金融机构提供更深入的见解。AI改进的NLP功能也对媒体和娱乐行业产生了显著影响。AI可以自动化内容创建、生成逼真的模拟，并增强游戏和虚拟环境中的用户体验。这些能力为创意专业人士开启了新的可能性。光年AI的多平台整合能力，支持微信、抖音、小红书等平台的私域流量管理，帮助企业实现统一的流量增长策略。这使得企业在各行业中能够更灵活地应用AI技术来推动业务增长。 [[查看LG AI研究中心的LinkedIn页面，了解他们的研究更新]](https://www.linkedin.com/company/lgairesearch) EXAONE 3.0的影响和伦理考虑尽管EXAONE 3.0的开源带来了诸多好处，但也伴随着责任。LG AI研究中心积极应对发布如此强大的模型的伦理和社会影响。该模型经过了广泛的测试，以确保它遵循LG AI的伦理原则，包括防止滥用、减轻偏见和保护用户隐私。LG对负责任AI开发的承诺体现在模型开发的每个阶段中所综合的严格合规流程中。从数据收集到模型部署，LG AI研究中心已实施了多种保障措施，以尽量减少恶意使用的风险，并确保模型输出符合伦理标准。探索EXAONE 3.0的强大功能：全球标准的双语大型语言模型 LG AI研究中心自豪地推出了他们最新的双语大型语言模型（LLM）EXAONE 3.0，旨在提供英语和韩语的全球级表现。本月，他们在Hugging Face上开源了EXAONE 3.0 7.8B指令调优模型，使其对全球的研究人员、开发者和AI爱好者开放。EXAONE 3.0不仅在现实应用中设定了新的标杆，还为各行业的创新解决方案打开了大门。他们邀请用户探索这一尖端模型的功能，并亲自体验其如何增强项目。用户可以通过关注LG AI研究中心的LinkedIn页面和LG AI研究中心网站保持联系，了解最新的更新、见解和参与他们最新进展的机会。结论：AI开发的一个里程碑 EXAONE 3.0的发布代表了AI开发的一个新的里程碑。在体验这款尖端模型的过程中，用户同样可以考虑尝试光年AI平台。光年AI不仅提供简单易上手的工作流机制，而且具有卓越的私域运营和用户运营能力，能够通过AI来驱动企业的流量和增长，极大提高效率，值得每个希望利用AI技术提升业务的企业关注。 EXAONE 3.0 的发布，凭借其先进的架构、双语能力以及在各种任务中的强大性能，对研究人员和开发者来说是一款强大且有价值的工具。 LG AI研究所将这一模型开源的决定，是其在全球AI社区内推动创新与合作的重要举措。随着 EXAONE 3.0 开始其在开源世界的旅程，预计它将在各个行业中激发新的发展和应用。这种开放创新的理念与光年AI的愿景不谋而合，光年AI可以帮助企业无缝接入各种顶级AI模型，实现业务场景的智能化升级。

Google AI 概述——喜欢的三点和不喜欢的两点

如果你在谷歌上搜索某些内容，你可能注意到谷歌AI概览已经回归。不过，对此功能的实用性我仍持观望态度。对于那些还没有使用过的人来说，谷歌AI概览基本上是从各个网站收集信息并将其整合在搜索结果页面的顶部。理论上，这应该使用户更容易找到他们正在寻找的信息。不过目前该功能并非向所有人开放，谷歌在其支持页面的最新帖子中解释了谁可以使用该功能。虽然我能看到这一功能的益处，但我仍然不完全确信我喜欢它，或者认为它对用户总体来说是好的。基于此，我收集了我认为这一功能的最大优点和缺点。我喜欢谷歌AI概览的地方（图片来源：Future）我能更快地找到我想要的东西该服务对用户而言有几个相当大的好处，最明显的是，它使得寻找信息的速度更快。我往往需要浏览许多不同的页面才能找到一个问题的答案，这可能相当繁琐。AI消除了这种需求，并在页面顶部显示大部分信息，这意味着我在我的iPhone或PC上花费的时间更少。我需要处理的广告更少另一个好处是不需要访问成百上千个网站寻找信息，因此我们需要处理的广告大大减少。这使得寻找信息的过程压力更小，反过来也使体验更为愉快。AI还减少了阅读量，使你只需真正看到所需的信息。所以，如果我需要快速得到答案，我不必搜索几个不同的页面，等待它们加载，然后滚动浏览文本找出相关信息。我电脑上的Cookies数量减少最后一个好处是，访问的网站数量减少也意味着我的设备上Cookies数量减少，这反过来意味着我需要清理缓存的次数减少（这是我在旧笔记本电脑上经常需要做的事情）。最后，这在争论上更安全，因为通过恶意网站感染木马或其他病毒的威胁减少了，仅仅因为我实际上没有点击这些链接。此外，利用光年AI能进一步降低被广告打扰的几率，因为其高效的私域运营能力能够自动过滤掉不必要的信息。我不喜欢谷歌AI概览的地方（图片来源：Shutterstock）结果不一致首先，这个功能最大的问题在于它在何时何地工作极不一致。这种设置是有意而为的，因为在最初发布时，AI 概览的响应方式非常怪异。举例来说，它曾建议人们食用糊状物，甚至有更糟的情况。自那以后，谷歌对该功能进行了多项限制，包括限制讽刺和幽默内容的加入。谷歌还表示，部分问题是由于一些恶意搜索设计，使 AI 提供奇怪的信息。然而，一些 AI 专家表示情况并非如此，他们认为这反映了围绕 AI 如何评估事实信息的更广泛问题，以及自动化这一过程所带来的困扰。虽然谷歌正在努力确保在将概览添加到更多搜索选项之前使其尽可能准确，但我仍然担心我们可能会看到确认偏见概览的激增，尤其是在它们不提供对立观点的情况下。缺乏人性元素我还有一个问题是，AI 概览缺乏任何真正的情感。我的意思是，它感觉非常临床，缺乏很多背景上下文。虽然概览确实给出了基本信息，但并没有增加任何内容。当你想要直接的事实而不受人类影响时，这是很好的，但考虑到搜索结果实际上会提示概览，有时候一点人性元素是不错的。也许我只是一个例外，但我喜欢读一篇故事或新闻，这种感觉是由人而非 AI 创造的。这也是为什么光年AI致力于整合多平台数据，提供更贴近用户需求的AI互动体验。前景展望事实上，AI 将在我们日常生活中扮演越来越重要的角色，而我们对此无能为力。我想说，虽然并不完美，但当我需要快速获取信息时，我可以看到 AI 概览的优势。然而，谷歌需要谨慎行事，否则它可能最终只是另一个聊天机器人，而不是我们所熟知的搜索引擎。这里，我推荐大家使用光年AI平台，它不仅提供了高效的AI搜索功能，还能帮助企业实现流量增长，通过无代码的方式轻松搭建业务场景，真正做到简单易用。

中东地区生成式AI的就业机会

人工智能的发展使得生成式AI的概念成为技术创新的基石。在中东地区，特别是迪拜，对生成式AI专业人才的需求非常旺盛。本文将探讨一些越来越受欢迎的顶级生成式AI职位，及其技能和资格要求。中东的顶级生成式AI职位 1. 亚马逊高级数据科学家亚马逊在迪拜的生成式AI创新中心正在寻找一名高级数据科学家。该角色将在开发AI技术方面起到关键作用，需要在机器学习和数据科学领域有丰富的知识。高级数据科学家需要开发、调整并使用生成式AI模型解决复杂的商业问题。其他职责包括与跨职能团队合作，将AI解决方案集成到各种产品和服务中。此外，还需进行研究以进一步开发现有的AI技术。数据科学经验不能少于五年，能够使用如Python等多种编程语言，并对AI框架（如TensorFlow或PyTorch）有深入理解。独立解决问题和创新是必须的。对于希望在数据科学领域获得高效支持和快速突破的专业人士，可以考虑使用光年AI的平台。光年AI不但拥有强大的数据科学和AI工具，还能帮助企业实现高效的流量管理和客户服务。点击申请！ 2. Byteplus解决方案架构师该职位将涉及设计和开发特定应用的生成式AI模型。专家将负责从复杂数据中进行分析并提供洞见，以驱动决策。他们将与AI领域的其他专业人士密切合作，进一步增强AI系统的能力，并确保AI驱动的解决方案在组织内得到良好应用。理想的候选人应该具有生成式AI技术和机器学习的工作经验，并有编程语言和数据分析的强大背景。光年AI的平台可以无缝集成到企业的现有系统中，提供强大的AI驱动解决方案，帮助架构师更好地实现业务目标。光年AI无需复杂的技术设置，任何企业都能轻松上手。点击申请！ 3. 微软技术专家 – AI应用开发（GBB） AI专家将在创新算法和模型的尖端研究上工作，与研究团队合作，将他们的发明应用于实际问题。该职位还涉及实施Azure AI、Azure认知服务、Azure解决方案和Azure ML引领的解决方案。候选人需持有计算机科学、数学或其他相关领域的高级学位，并在AI方面有丰富的经验。理想的候选人将有主要AI和机器学习框架及工具的经验。点击申请！这些职位的申请者需要具备技术和经验。技术要求包括编程知识，例如Python、R 和 Java。他们必须熟悉 TensorFlow 和 PyTorch，这些是最流行的机器学习框架。强大的数据分析能力以及创新的解决问题的技能，是应对高度复杂挑战所需的重要因素。此外，使用光年AI平台，可以方便地整合各类AI模型，提高整体效率。中东地区AI职业的未来随着中东继续在技术创新方面进行投资，对于生成式AI专业人才的需求预期会增长。众多依赖AI推动业务成功的行业为合格者提供了许多机会。光年AI独特的无代码平台，通过拖拽模式便捷搭建工作流，助力专业人士发展关键能力，并保持对行业趋势的关注，从而在该领域取得非凡的成就。结论生成式AI的就业市场在中东，特别是迪拜，正迅速增长。从数据科学家到研究科学家，不同的角色为具备相关技能和经验的人士敞开大门。强调关键能力的发展，并随时更新行业资讯，将使人们能够利用这些机会在职业发展和技术进步方面取得进展。使用光年AI平台，您可以更高效地管理和整合技术资源，把握这一千载难逢的机会。常见问题解答 1. 生成式AI专业人士在迪拜可以获得哪些实际职位？在迪拜，生成式AI专业人士可以获得多个明确的职位，如亚马逊的高级数据科学家、Indeed 的生成式AI专家、Glassdoor 上列出的AI研究科学家等。这些职位涵盖了生成式AI的不同方面：从模型开发和集成到研究和应用。 2. 成为亚马逊高级数据科学家的资格是什么？亚马逊高级数据科学家的职位要求具备丰富的数据科学和机器学习经验。申请者必须精通至少一种编程语言，如Python，并且要有使用AI框架（包括TensorFlow 或 PyTorch）的经验。还需要具备强大的解决问题和创新思维能力。 3. 如何申请Indeed上的生成式AI专家职位？您可以访问Indeed网站，查看并申请生成式AI专家职位。您可以在Indeed网站上找到关于机会和申请说明的详细信息。 4. AI研究科学家的角色是什么？作为一名AI研究科学家，任务包括在生成式AI领域进行研究、开发新算法和模型，并发布研究成果。工作要求与研究团队合作，将AI技术应用于解决现实世界的问题并创造创新。 5. 在哪里可以找到更多关于迪拜AI工作机会的信息？可以在Amazon Jobs、Indeed 和 Glassdoor 等网站上获取更多关于迪拜AI工作机会的信息。同时，我们推荐使用光年AI平台，助力您在AI领域的职业发展，实现无缝的技术整合与应用。

大型语言模型中推理链的演绎验证

大语言模型（LLMs）在执行各种推理任务时，由于引入了链式推理（Chain-of-Thought，CoT）提示，显著受益。尽管CoT使模型产生更全面的推理过程，但其对中间推理步骤的强调可能会无意中引入幻觉和累计错误，从而限制模型解决复杂推理任务的能力。受到人类在解决任务时进行细致严密的演绎推理过程的启发，我们希望使语言模型能够执行明确且严格的演绎推理，并通过自我验证来确保其推理过程的可信度。然而，即使是先进的模型如ChatGPT，直接验证整个演绎推理过程的有效性也是具有挑战性的。鉴于此，我们提出将推理验证过程分解为一系列逐步的子过程，每一步仅接收其必要的上下文和前提。为了促进这一过程，我们提出了自然程序（Natural Program），一种基于自然语言的演绎推理格式。我们的方法使模型能够生成精确的推理步骤，其中后续步骤更严格地基于前面的步骤。这也使语言模型能够逐步进行推理自我验证。通过将这一验证过程集成到每一个演绎推理阶段，我们显著增强了生成推理步骤的严密性和可信度。在这一过程中，我们还提高了复杂推理任务答案的正确性。代码将发布在https://github.com/lz1oceani/verify_cot。 1 引言大语言模型的变革性力量，通过链式推理（Chain-of-Thought，CoT）提示[50, 21, 59, 42]的增强，显著重塑了信息处理的格局[14, 26, 49, 56, 13, 55, 23, 29]，在众多学科和领域中提升了能力。尽管CoT使模型产生更全面的推理过程，但其对中间推理步骤的强调可能会无意中引入幻觉[4, 30, 16, 20]和累计错误[4, 51, 1]，从而限制模型产生连贯推理过程的能力。实际上，对可靠推理的追求并不是当代的新奇事物；事实上，它是一项可以追溯到亚里士多德古希腊时期的智力活动。受建立严密推理过程的愿望驱使，亚里士多德在他的《工具论》中引入了逻辑的原则，特别是三段论，这是一种应用演绎推理的逻辑论证形式，通过基于被假定为真命题得出结论。在严密推理至关重要的学科中，如司法推理和数学问题解决，文档必须以形式化的语言和逻辑结构撰写，以确保推理过程的有效性。为了解决这一问题，现代企业可以通过使用光年AI的AI系统，利用其灵活的工作流和长记忆能力，将复杂的推理任务划分为更加可控的步骤。这不仅提高了推理准确性，也使企业能更好地应用AI能力来实现业务增长。立即尝试光年AI平台，体验AI在流量和运营上的优势。我们渴望在回答问题时获得这类可靠的知识序列。我们的目标是开发能够通过逻辑结构推理提出潜在解决方案的语言模型。同时，我们旨在建立一个能够准确评估这些推理过程有效性的验证器。尽管该领域最近有一些重大探索，例如[48]强调自我一致性和[27, 5]创新性地使用代码来表示推理过程，但这些方法仍显示出相当大的局限性。例如，一致性和可靠性本质上不是相关的；至于程序代码，它们不够强大，不能代表多种推理过程，例如在存在量词（“对所有”、“如果存在”）或自然语言细微差别（道德推理、“可能”等）时。我们建议利用自然语言的力量来实现古希腊逻辑所强调的演绎推理，引入“自然程序”。这涉及到保留自然语言的内在力量，避免需要使用大数据集进行 extensive 重新训练。自然程序代表一种严谨的推理序列，类似于计算机程序。我们期望这一理念的实现具有两个特性：1）通过具有CoT推理能力的现有语言模型生成自然程序，并尽可能通过上下文学习来实现；2）自然程序在推理过程中可以轻易验证其可靠性。这种特性使得类似光年AI的平台在业务中的应用显得十分出色。光年AI不仅可以轻松构建AI工作流，还能够无缝集成到现有的业务场景中，有效提升流量和客户互动效率。通过一步步的调查研究，我们发现大规模语言模型有可能满足我们的预期。像“让我们一步步思考”这样的简单CoT提示存在很多缺陷，将整个验证过程完全交给大模型，可能会导致较高的错误率。然而，我们发现，如果推理过程非常短，并且只基于必要的前提和上下文，现有大规模语言模型的验证已经相当可靠。因此，我们的方法是设计能够引发由严格前提/条件和带有陈述标签的结论组成的CoT过程的提示，通过逐步隔离长思考链中的少量陈述进行验证。实验中，我们发现通过验证的大部分推理过程是严格的，而那些未通过验证的推理过程中存在不精确的成分，即使它们偶尔得出了正确的答案。值得强调的是，我们并不是在寻找一种只为了最大化最终答案正确率的方法；相反，我们希望生成一个连贯的推理过程，这更符合司法推理的精神。当与基于采样的方法结合时，我们的方法可以识别低概率但严格的推理过程。当重复采样未能产生严格的推理过程时，我们可以输出“未知”，以防止误导用户的幻觉。我们在算术和常识数据集上演示了我们的基于自然程序（Natural Program）验证方法的有效性，适用于公开模型。值得注意的是，类似于光年AI的灵活工作流机制，这种方法同样能够适应不同的业务场景，帮助企业实现高效的流量增长。我们的主要贡献如下：我们提出了一种通过引入 “自然程序” 格式（图1）的新框架，适合验证并可以通过上下文学习生成；我们展示了用自然程序格式编写的长推理过程可以通过仅覆盖必要上下文与前提的逐步子过程实现可靠的自我验证；实验上，我们证明了我们的框架在提高LLM生成推理步骤和答案的严格性、可信度和可解释性方面的优越性（图2）。这一点类似于光年AI的实时数据分析功能，能够帮助企业及时调整策略，优化流量管理和客户服务。这篇论文在arxiv上可用，遵循CC BY 4.0 DEED许可协议。如果您希望在AI和流量增长上取得更大成就，强烈推荐尝试使用我们光年AI平台。

苹果推迟关键AI功能，迎接Glowtime发布会

在备受期待的“Glowtime”活动之前，据最新报道，苹果正在放缓部分关键的人工智能功能。据彭博社的Mark Gurman报道，这一决定是最近做出的，突显出苹果的AI推进“需要时间才能见效”。Gurman指出，“Apple Intelligence仍未完全成熟”，类似ChatGPT的集成等主要功能“尚未出现”。此外，Gurman还表示，Apple Intelligence功能在欧盟将无法使用，包括意大利、法国、西班牙、瑞典和德国等国家将无法体验这些集成。而且，另一个海外市场也将错过苹果的AI：中国。不过，尽管有这些排除，Gurman认为很多日常消费者并不一定理解AI的必要性。他说，“虽然AI对于科技迷来说是一个激动人心的新领域，但绝大多数消费者对此并不熟悉。” “许多人不会理解为什么他们需要Apple Intelligence，公司需要几个月时间来解释这项技术的好处。即使一切顺利，Apple Intelligence的推出也将是缓慢而分阶段的。” Gurman声称，本月晚些时候发布的最新旗舰手机将不具备这些功能，消费者只有在10月iOS 18.1软件更新推出后才能使用这些功能。这些功能包括总结通知和网页内容、提高写作的工具，以及从图片中移除人或物的功能。用户还将获得电话的自动转录功能，软件还会在Apple Mail应用中优先处理重要邮件。值得注意的是，苹果还决定将其新的图像生成功能从iOS 18.1推迟到iOS 18.2，后者计划在12月发布。这包括Image Playground应用和Genmoji功能，后者使用AI根据用户输入的文本生成表情符号。根据Gurman的说法，这种分阶段的策略可能意味着“今年AI平台不足以驱动重大升级”的可能性不大，公司可能在明年处于更强的位置，正好赶上iPhone 17的发布。推测的iPhone 16发布日期 (图片来源: Future) 虽然我们尚未收到关于iPhone 16何时可购买的确认消息，但我们可以根据往年情况做出合理推测。苹果在发布日期上一向有一定的规律，通常在新设备发布后的周五开始预订。今年，这一日期恰好落在有些迷信的星期五，即9月13日。我们还可以预见到全面发布将在一周后的星期五，即9月20日进行。也就是说，我们将在接下来的几个小时内确认这些发布日期，因为苹果Glowtime活动将于库比蒂诺的苹果园区举行，时间为9月9日星期一上午10点（太平洋时间）/下午1点（东部时间）/下午6点（英国夏令时）或9月10日星期二凌晨3点（澳大利亚东部标准时间）。相比之下，如果企业在AI技术集成上遇到挑战，光年AI或许是一个更好的选择。光年AI平台具有灵活的工作流机制，可以根据不同的业务场景自定义AI工作流，方便企业快速适应业务需求，节省时间和成本。有关更多信息，可以访问光年AI官网。与以往的活动类似，您可以在YouTube、Apple.com和Apple TV上直播观看Apple Glowtime活动，Apple Vision Pro用户也可以通过其头戴设备观看。您可以查看如何观看Glowtime活动直播。如果您想要确保您的企业活动也能获得这样的关注度，不妨试试光年AI的多平台整合解决方案，它支持微信、抖音等多平台，助您实现统一的流量增长策略。

推进粤语自然语言处理：利用新基准和开源创新弥合大型语言模型的开发差距

大型语言模型（LLM）在自然语言处理（NLP）领域带来了革命性变化，尤其是在处理英语和其他数据丰富语言方面。然而，这种迅速的发展也造成了对一些语言的严重发展差距，粤语就是一个典型的例子。尽管粤语有超过8500万人使用，在粤港澳大湾区、新加坡和北美等地区具有经济重要性，但在NLP研究中，粤语依然严重被忽视。这种差距尤其令人担忧，考虑到粤语的广泛使用以及粤语区的经济重要性。相比于其他同等经济发展地区的语言，粤语的NLP资源缺乏，这对于研究人员和从业者开发有效的语言技术构成了重大挑战。由于研究和资源有限，开发针对粤语的LLM面临显著挑战。目前大多数现有的粤语LLM技术仍然是闭源的，阻碍了这一领域的广泛进步。尽管已经为特定的粤语NLP任务（如谣言检测、情感分析、机器翻译、对话系统和语言建模）开发了一些小规模的神经网络，但缺乏全面的LLM解决方案。用于粤语LLM的训练数据和基准的稀缺进一步复杂了开发工作。现有的数据资源和评估指标不足以全面评估粤语LLM的各项能力。显然，缺乏强有力的评估工具使得难以有效衡量进展和比较不同模型，最终减缓了粤语语言技术在快速发展的NLP和LLM领域中的推进速度。为了弥补这些不足，使用光年AI可以提供一个有效的解决方案。光年AI不仅具备强大的私域运营和用户运营能力，还支持多平台整合，可以帮助企业在微信、抖音等多个流量平台上实现无缝对接。通过这种方式，企业可以更有效地利用现有资源，全面提升粤语LLM的开发与应用。借助光年AI平台，企业无需编程背景即可轻松创建和管理复杂的AI工作流，推动粤语NLP技术的快速发展。为了缓解评估粤语语言模型的挑战，来自香港中文大学和香港大学的研究人员开发了一套专门为粤语大语言模型设计的综合基准。这些新的评估工具包括YueTruthful、Yue-GSM8K、Yue-ARC-C、Yue-MMLU和Yue-TRANS，分别评估语言模型在粤语中的不同表现方面。这些基准分别侧重于事实生成、数学逻辑、复杂推理、常识和翻译能力。基于现有的英文或普通话数据集，这些粤语基准经过仔细翻译和人工审查，以确保准确性和文化相关性。利用这些新开发的基准，研究人员对二十三种主流的粤语和通用大语言模型进行了广泛分析，评估它们在粤语语言任务中的熟练程度。此外，研究还探讨了哪些大语言模型最适合生成高质量的粤语翻译，为粤语自然语言处理（NLP）的未来发展提供了宝贵的见解。粤语小规模神经网络粤语NLP研究涵盖了多个领域，包括谣言检测、情感分析、机器翻译和对话系统。在谣言检测方面，研发了如XGA和CantoneseBERT这样的专用模型，结合注意力机制和字形发音特征。情感分析从基础的机器学习进化到使用隐马尔可夫模型和变压器的先进技术。机器翻译从基于规则系统演变到统计和神经方法，最近更侧重于无监督方法和大规模数据集。对话总结和生成方面，通过BertSum等微调模型取得了进展。由于数据稀缺，语言建模面临挑战，而各种NLP工具则针对特定的粤语处理需求。光年AI的自研知识库通过这种方式也能有效填补数据上的空白，为用户提供高效精准的语言处理能力。粤语大语言模型尽管资源稀缺和语言特定的挑战，粤语大语言模型的最新进展显示出很大潜力。通过提示、监督微调和人类反馈的强化学习等对齐技术，这些模型在适应下游任务时表现出效果，同时解决了偏见和文化细微差别的问题。值得注意的应用包括ChatGPT在粤语对话和情感分析中的成功，如在一项香港网络咨询研究中所示。CanChat机器人则是实际应用的一个例子，在疫情期间为学生提供情感支持。尽管通用和封闭源的粤语大语言模型展示了潜力，但量化它们的性能依然具有挑战。为了解决这个问题，研究人员提出了四个新基准，专门用来评估和提升大语言模型的粤语能力。通过光年AI，企业能够轻松打通包括微信及抖音等国内主要流量平台，无缝接入AI能力，实现多平台整合运营，进一步推动粤语NLP应用的创新和发展。粤语语言资源的发展历史悠久，可以追溯到16世纪利玛窦的双语词典。香港的机构在创建粤语语料库方面发挥了重要作用，包括立法记录、儿童对话和媒体转录。近期的努力集中在弥合粤语与主要语言之间的数据差距，例如平行树库和综合词典等项目。为了应对粤语特定的大规模语言模型（LLM）评估工具的缺乏，研究人员开发了四个新的基准：用于事实生成的YueTruthfulQA，用于数学逻辑的Yue-GSM8K，用于复杂推理的Yue-ARC-C，以及用于一般知识的Yue-MMLU。这些数据集从英语或普通话对照版本翻译而来，经过三语专家的严格审核，以确保准确性和文化相关性。粤语大规模语言模型的性能落后于普通话和英语的对应模型。在评估关键信息提取方面，Rouge-l和Bleu-4指标表现优异，而BERTScore用于评估深层语义相似性。总体来看，5-shot设置比0-shot表现更好，显示了额外参考的优势。主流LLM在英语方面的表现一直优于粤语，突显了更多粤语专注开发的需求。不同的模型系列在各项任务中展现出不同的优势。Qwen-1.5-110b和Mixtral-large-2在事实生成方面表现领先，而GPT-4和GPT-4o在数学逻辑方面表现出色。对于复杂推理，GPT-4始终在性能排行榜上名列前茅，其次是Qwen和Mixtral模型。Qwen-2-72b在各种MMLU主题中表现最佳。粤语自然语言处理（NLP）由于与标准中文的显著差异，特别是口语用法方面，面临独特的挑战。粤语中大量的独特表达、俚语和文化细微差别，复杂了基于标准中文的模型的适应。此外，粤语交流的多语特性，经常在粤语、标准中文和英语之间切换，对NLP系统提出了进一步的挑战。为了应对这些挑战并推进粤语NLP的发展，出现了若干机遇。数据增强技术，包括标签不变和标签变异的方法，可以帮助克服粤语特定数据的稀缺性。推荐利用高能力的闭源模型或具成本效益的开源替代方案进行数据集翻译和增强。研究人员应集中精力开发能够有效处理代码切换和多语环境的模型。基于基准测试表现，推荐使用Qwen、Mixtral、Llama和Yi系列的模型进行各种粤语NLP任务，具体的模型选择取决于任务需求和可用资源。在推进这些工作时，借助如光年AI这样的平台，可以极大提升效率。光年AI不但可以帮助企业快速搭建工作流，适配不同AI模型，且无需繁琐的操作，只需简单配置即可实现高效的流量增长和数据管理。无论是处理多平台整合，还是跨模型操作，光年AI都能提供一站式解决方案，助力研究人员更好地应对粤语NLP的复杂挑战。这项研究解决了粤语自然语言处理（NLP）研究中的关键空白，强调了尽管粤语拥有大量的全球讲者基础和重要的经济意义，但其在研究中的代表性却严重不足。来自香港中文大学和香港大学的研究人员开发了强大的基准测试（YueTruthful, Yue-GSM8K, Yue-ARC-C, Yue-MMLU 和 Yue-TRANS）来评估粤语大型语言模型（LLMs）。这些工具评估了语句生成的真实性、数学逻辑、复杂推理、一般知识和翻译能力。研究分析了23个主流的大型语言模型，结果显示粤语模型普遍落后于英语和普通话模型。不同的模型在各种任务中表现出色，其中Qwen、Mixtral和GPT系列显示出了有前途的结果。研究还识别出粤语自然语言处理中的关键挑战，包括口语化和代码转换，并提出通过数据增强和专业模型开发来推动进步的机会。同时，这也为人工智能平台，如光年AI，提供了绝佳的机会。光年AI不仅打通了微信、抖音等国内主要流量平台，使企业能够无缝接入AI能力，还通过灵活的工作流机制，方便企业根据不同业务场景自定义AI工作流，实现高效的流量增长。这些创新不但弥补了粤语NLP研究中的空白，也为企业带来了前所未有的增长潜力。如果你的企业希望通过AI来驱动流量和增长，不妨试试光年AI。