人工智能学习笔记

快速部署YOLOv9

from ultralytics import YOLO # Build a YOLOv9c model from scratch model = YOLO("yolov9c.yaml") # Build a YOLOv9c model from pretrained weight model = YOLO("yolov9c.pt") # Display model information (optional) model.info() # Train the model on the COCO8 example dataset for 100 epochs results = model.train(data="coco8.yaml", epochs=100, imgsz=640) # Run inference with the YOLOv9c model on the 'bus.jpg' image results = model("path/to/bus.jpg")

GPT4o可能用了什么技术!

作为GPT-4的扩展,我基于以下技术实现和优化,使得性能比GPT-4更好且速度更快: 1.架构改进 改进变压器架构,包括: 更深层次的网络:增加了变压器的层数,使模型能够捕捉更复杂的语言模式和语义信息。 更宽的网络:增加了每层的神经元数量,提升了模型的容量和表达能力。 2.高效的训练方法 混合精度训练:采用混合精度计算(使用16位和32位浮点数),提高训练速度的同时节省内存。 分布式训练:利用多GPU和TPU集群进行分布式训练,显著加快了型的训练过程。

ChatGPT 正在做什么……为什么它有效?(上)

ChatGPT 能够自动生成类似于人类书写文本的东西,即使是表面上的相似,这是非常了不起的,也是出乎意料的。但它是如何做到的呢?为什么它会起作用呢?我的目的在于大致概述 ChatGPT 内部发生的事情,然后探讨它为什么能够在生成我们认为有意义的文本方面做得如此出色。我应该在一开始就说,我将专注于正在发生的大局,并且虽然我会提到一些工程细节,但我不会深入探讨它们。(我将要说的实质同样适用于其他当前的“大型语言模型”[LLMs],如同适用于 ChatGPT。)

ChatGPT 正在做什么……为什么它有效?(下)

The Practice and Lore of Neural Net Training神经网络训练的实践与知识 特别是在过去的十年里,神经网络训练的艺术取得了许多进展。是的,这基本上是一门艺术。有时候,尤其是事后,人们可以看到至少有一点“科学解释”来解释正在进行的事情。但大多数情况下,这些发现都是通过反复试验、添加想法和技巧来逐步建立了关于如何处理神经网络的重要知识。 有几个关键部分。首先,关键是要考虑为特定任务使用什么样的神经网络架构。然后是如何获取用于训练神经网络的数据的关键问题。而且,越来越多的情况下,不再需要从头开始训练网络:相反,一个新网络可以直接整合另一个已经训练好的网络,或者至少可以使用该网络为自己生成更多的训练示例。
NotionNext
NotionNext
一个普通的干饭人🍚
Announcement
🌟 欢迎来到盛溪的博客!🌟
大家好,我是盛溪。在这里,我将分享我的生活感悟、学习心得以及其他一些有趣的发现。希望我的文章能为你的生活带来一点启发和乐趣。
📅 更新通知:
  • 我会定期更新博客,分享新的内容。你可以通过RSS订阅或关注我的社交媒体账号来及时获取更新通知。
💬 互动环节:
  • 如果你有任何问题或想法,欢迎在评论区留言。我非常期待与你的互动!
📚 推荐阅读:
  • 不定期推荐一些我觉得有价值的书籍或资源,希望能对你有所帮助。
感谢你的访问和支持,希望你能常来逛逛!
盛溪敬上