12℃什么是多模态深度学习?定义、原因、应用和挑战 – AI百科知识

什么是多模态深度学习?多模态深度学习(英文名:Multimodal Deep Learning)是人工智能(AI)的一个子领域,其重点是开发能够同时处理和学习多种类型数据的模型。这些数据类型,或称模态,可以包括文本、图像、音频、视频和传...

13℃Video-LLaVA2 – ChatLaw推出的开源多模态智能理解系统

Video-LLaVA2是什么Video-LLaVA2是由北京大学ChatLaw课题组推出的开源多模态智能理解系统,通过创新的时空卷积(STC)连接器和音频分支,提升了视频和音频理解能力。模型在视频问答和字幕生成等多个基准测试中表现出色,...

13℃什么是强化学习Reinforcement Learning?定义、概念、应用和挑战 – AI百科知识

强化学习(RL)是机器学习的一个分支,重点是训练算法通过与环境的互动来做出决定。它的灵感来自于人类和动物从他们的经验中学习以实现目标的方式。在这篇文章中,我们将对强化学习、其关键概念和应用进行全面概述。一、什么是强化学习?强化学习(英文:...

24℃AI快讯:3月第1期(3月1日到3月10日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为3月第1期(3月1日到3月10日)的AI行业新闻集合。3月10日微软德国CTO Andreas Braun表示将在下周推出GPT-4,可能与百度文心的发布会在同一天(3月1...

12℃HMoE – 腾讯混元团队提出的新型神经网络架构

HMoE是什么HMoE(混合异构专家模型)是腾讯混元团队提出的新型神经网络架构,旨在提升大型语言模型的性能和计算效率。通过引入不同尺寸的专家来处理不同复杂性的输入数据,从而增强模型的专业化程度。HMoE采用新的训练目标和策略,如P-Pen...

10℃什么是预训练Pre-training?定义、重要性、技术和挑战 – AI百科知识

随着人工智能(AI)不断重塑我们的世界,其发展的一个关键方面已经成为现代机器学习模型的支柱:预训练。在本篇文章中,我们将探讨预训练的概念,它在人工智能中的重要性,用于实现预训练的各种技术,以及该领域的研究人员所面临的一些挑战。什么是预训练?...

8℃AI快讯:4月第2期(4月11日到4月20日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为4月第2期(4月11日到4月20日)的AI行业新闻集合。4月20日知名图像生成模型Stable Diffusion背后的公司Stability AI宣布开源类ChatGPT...

11℃AI快讯:4月第1期(4月1日到4月10日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为4月第1期(4月1日到4月10日)的AI行业新闻集合。4月10日AI领域的两位重量级人物Andrew Ng(吴恩达)和Yann Lecun(杨立昆)在直播中反对“暂停6个月...

11℃AI快讯:3月第3期(3月21日到3月31日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为3月第3期(3月21日到3月31日)的AI行业新闻集合。3月31日意大利个人数据保护局近日发布公告,禁止使用聊天机器人ChatGPT,并限制开发这一平台的OpenAI公司处...

10℃什么是LLM大语言模型?定义、训练方式、流行原因和例子 – AI百科知识

近年来人工智能(AI)领域经历了巨大的增长,而自然语言处理(NLP)更是其中一个取得快速进展的领域。NLP中最重要的发展便是大语言模型(LLM),该项技术可能彻底改变我们与科技互动的方式,加上OpenAI的GPT-3的爆火,使得大语言模型在...

12℃什么是情感分析(Sentiment Analysis)? – AI百科知识

在今天这个数字连接的世界里,人们不断地在各种平台上分享他们的想法和意见,从社交媒体网站到在线评论论坛。这些用户生成的文本提供了海量的信息,企业、政府和其他组织可以利用这些信息来获得对其客户的偏好、意见和情感的宝贵见解。作为自然语言处理(NL...

14℃LitServe – 基于FastAPI的高性能AI模型部署引擎

LitServe是什么LitServe是基于FastAPI的高性能AI模型部署引擎,专为企业级AI服务设计。支持批处理、流式处理和GPU自动扩展,简化了模型部署流程。LitServe易于安装和使用,通过pip即可安装,提供灵活的API定义...

14℃什么是数据标注?机器学习中数据标注的重要性、类型和挑战 – AI百科知识

什么是数据标注机器学习(ML)已经成为各种行业的重要组成部分,如医疗保健、金融和运输,因为它能够根据大量的数据进行分析和预测。其中,机器学习过程的一个重要方面便是数据标注(Data Annotation),数据标注是一个对原始数据进行标记...

13℃AI快讯:5月第1期(5月1日到5月10日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为5月第1期(5月1日到5月10日)的AI行业新闻集合。5月10日Meta 公司发布了一个新的开源人工智能模型 ImageBind,该模型能够将多种数据流,包括文本、音频、视...

9℃CustomCrafter – 腾讯联合浙大推出的自定义视频生成框架

CustomCrafter是什么CustomCrafter 是腾讯和浙江大学联合提出的自定义视频生成框架,能基于文本提示和参考图像生成高质量的个性化视频,同时保留了运动生成和概念组合的能力。CustomCrafter通过设计一系列灵活的模...

7℃AI快讯:4月第3期(4月21日到4月30日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为4月第3期(4月21日到4月30日)的AI行业新闻集合。4月30日米哈游《崩坏:星穹铁道》网页活动 —— 「无尽的三月七」上线,「无尽的三月七」基于米哈游自研的 AIGC...

12℃LeRobot – HuggingFace推出的开源AI聊天机器人项目

LeRobot是什么LeRobot是由HuggingFace推出的开源AI聊天机器人项目,由前特斯拉研究员Remi Cadene领导开发。LeRobot致力于降低机器人技术的入门门槛,提供预训练模型、数据集和模拟环境,支持模仿学习和强化学...

9℃AI快讯:5月第2期(5月11日到5月20日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为5月第2期(5月11日到5月20日)的AI行业新闻集合。5月20日国家超算天津中心重磅发布了立足国产天河超级算力和智能算力打造的“天河E级智能计算开放创新平台”和“天河天元...

9℃什么是卷积神经网络(CNN)?定义、工作原理和主要应用 – AI百科知识

什么是卷积神经网络?卷积神经网络(Convolutional Neural Network,CNN)是一类主要用于计算机视觉领域的深度学习算法,它们在各个领域都有应用,包括图像和视频识别、自然语言处理,甚至是玩游戏。CNN已经彻底改变了计...

13℃LongVILA – 面向长视频理解的视觉语言AI模型

LongVILA是什么LongVILA是一个面向长视频理解的视觉语言AI模型,由英伟达、MIT、UC 伯克利、得克萨斯大学奥斯汀分校共同开发。通过算法和系统的共同设计,实现了在大量GPU上进行超长上下文长度训练的能力,无需梯度检查点。Lo...

10℃EasyOCR – 支持超80种语言的开源OCR项目

EasyOCR是什么EasyOCR 是一个功能强大的开源OCR(光学字符识别)项目,支持80多种语言和多种书写系统,包括中文、阿拉伯文和西里尔文。基于深度学习技术,提供高精度的文字识别能力。用户可以通过简单的API轻松地将图像中的文本转换...

12℃OmniCorpus – 百亿级多模态数据集,支持中英双语

OmniCorpus是什么OmniCorpus是一个大规模多模态数据集,包含86亿张图像和16960亿个文本标记,支持中英双语。由上海人工智能实验室联合多所知名高校及研究机构共同构建。OmniCorpus通过整合来自网站和视频平台的文本和...

10℃AI快讯:6月第2期(6月11日到6月20日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为6月第2期(6月11日到6月20日)的AI行业新闻集合。6月20日国家网信办发布境内深度合成服务算法备案信息,《互联网信息服务深度合成管理规定》第十九条明确规定,具有舆论属...

9℃什么是LoRA?一文读懂低秩适应的概念、原理、优缺点和主要应用

近年来自然语言处理(NLP)的进步很大程度上是由越来越强大的语言模型推动的,比如 OpenAI 的 GPT 系列大语言模型。然而,这些模型的训练不仅在计算上很昂贵,而且还需要大量的数据、能量和时间。因此,研究人员一直在探索更有效的方法来微调...

10℃AI快讯:6月第1期(6月1日到6月10日的AI行业新闻)

AI工具集采用每月3期的版面集合,每日更新AI行业的最新快讯,本期为6月第1期(6月1日到6月10日)的AI行业新闻集合。6月10日国内又一高校引入ChatGPT,为方便学校师生使用ChatGPT,南京理工大学信息化建设与管理处推出Chat...