huARdb:单细胞水平克隆型-转录组分析的人类抗原受体数据库

发布时间 - 2025-07-15 00:00:00    点击率:

前言

摘要

人类的适应性免疫系统是免疫反应的一个重要分支,负责识别和清除特定抗原。通过与特定抗原的结合,适应性免疫系统被激活,并能保存对目标抗原的长期免疫记忆。因此,具有高特异性的长期免疫记忆能够在后续抗原暴露中引发更强烈的反应。适应性免疫反应的激活需要T细胞或B细胞上的受体识别抗原,这些受体分别称为T细胞受体(TCR)或B细胞受体(BCR)。

TCR由成对的α和β肽链组成,而BCR由重链和轻链组成,每条链包括可变区(V区)和恒定区(C区)。每个TCR/BCR肽链的V区由可变(V)基因、多样性(D)基因和连接(J)基因的随机重组编码。在T或B细胞发育过程中,V(D)J基因重组为每个T或B细胞上的TCR/BCR产生独特的互补决定区(CDR),从而赋予其特异性。每个TCR/BCR肽链的V区包含CDR1、CDR2和CDR3,其中CDR3在抗原识别中起关键作用。

在T细胞和B细胞成熟过程中,随机的V(D)J基因重组为每个细胞产生独一无二的TCR/BCR,形|成人|体中高度多样性的TCRs/BCRs库,以应对环境中多样的病原体。单细胞免疫组库分析结合单细胞转录组分析使得在正常和病理条件下对单个TCR/BCR克隆型和功能的高通量研究成为可能。过去产生的大量公开的单细胞免疫组库数据需要深入分析,以揭示更多的免疫学机制。然而,目前尚无方法可以对已发表的单细胞免疫组库数据进行再利用和无偏的整合分析。

huARdb数据库收集了215份单细胞免疫组库数据。这些数据来自493个不同的测序文库,覆盖24种不同组织和12种不同疾病模型。作者通过使用统一的数据处理流程对每个单细胞免疫组库数据进行处理,获得每个数据集的单细胞水平TCR/BCR和转录组特征。作者同时开发了网页以展示数据库中各数据集的转录组相关特征和TCR/BCR相关特征。用户可以在主页上观看操作演示视频,通过疾病、组织类型、细胞类型索引,分析感兴趣的样本。对于单个免疫组库数据集,用户可以查看样本数据的各项转录组特征,例如各亚型细胞在tSNE图上的分布。当用户对某一细胞亚型感兴趣时,可以在网页菜单中选择相应的细胞亚型名称,高亮显示特定亚型的细胞分布。

同时,huARdb还首次开发了克隆型-转录组联合可视化分析方法。通过细胞TCR/BCR特征定义细胞克隆型,用户不仅可以查看各克隆型的细胞频率,还可以分析数据集内高度扩增克隆细胞的转录组特征,例如可以看到和分析每个克隆型内细胞亚型的分布信息,以及在单细胞水平上查看高度扩增克隆型细胞的TCR/BCR信息和转录组信息。

数据库概况

huARdb收集了14个人类单细胞免疫分析数据集,包括GEO、SRA和Genome Sequence Archive,涵盖来自24种组织类型和12种疾病的细胞。收集了231个耦合的scRNA-seq和scV(D)J-seq数据集。经过质量控制和数据过滤后,剩下215个数据集,其中包含444,794个具有成对TCR/BCR链的hcT/B细胞,平均在每个数据集中捕获了2,069个hcT/B细胞和13,493个基因。

通过细胞亚型预测,huARdb对402,557个hcT细胞(90.5%)和42,237个hcB细胞(9.5%)进行了分类:T细胞进一步分为效应记忆CD8+ T细胞、Th1/Th17细胞、调节性T细胞等13种不同的亚型,而B细胞进一步分为naive B细胞、耗竭性B细胞、非转换记忆B细胞、转换记忆B细胞和浆母细胞。

数据处理方法

预处理:使用Cell Ranger (v6.1.0)的默认参数处理耦合的单细胞(sc)RNA-seq和scV(D)J-seq数据。mkgtf函数用于保留编码蛋白序列,mkrefmkvdjref用于对hg38构建索引。scRNA-seq的fastq原始数据使用count获得编码蛋白基因的UMI矩阵,scV(D)J-seq的fastq原始数据使用vdj生成V、(D)、J、C基因使用情况、CDR3序列和TCR/BCR链的UMI计数。

质控过滤:使用Seurat (v4.0.2)去除unique feature counts 20%的细胞,并使用DoubletFinder去除双细胞。

细胞亚型预测:在去除双细胞后,使用Seurat (v4.0.2)将表达矩阵导入为Single Cell Experiment (SCE)对象,然后使用LogNorm-Counts转换为log矩阵。SingleR利用人类T或B细胞参考数据集进行细胞亚型预测。

预测的效应记忆CD8+ T细胞、中心记忆CD8+ T细胞、终末效应CD8+ T细胞和naïve CD8+ T细胞如果表达CD4,则被归类为“未预测”细胞。预测的辅助T细胞(Th细胞)和滤泡辅助T细胞如果表达CD8A,则被归类为“未预测”细胞。每个预测的细胞亚型的前10个标记基因被定义并使用Scanpy Python-package中的pl.rank genes groups_matrixplot函数进行可视化。

非监督聚类:使用Scanpy Python-package (v1.7.2)的scanpy.pp.normalize total将表达矩阵进行标准化,转为CPM,然后使用scanpy.pp.log1p + scanpy.tl.pca进行log+PCA。使用scanpy.pp.neighbors构建neighborhood graph,使用scanpy.tl.leiden进行非监督聚类。

每群细胞的前10个标记基因使用pl.rank genes groups matrixplot获得。

鉴定高置信度的T或B细胞(hcT/B细胞):首先使用Scirpy (v0.7.0)将V(D)J基因注释和每个TCR/BCR的CDR3序列加载进来。接着进行一系列严格的过滤:只保留同时具有转录组和TCR/BCR信息的细胞;只考虑具有配对轻/重链(BCR)或α/β链(TCR)的有效T或B细胞;过滤掉具有额外、孤立或未配对(两条同类型的链)的TCR/BCR链的细胞;数据库中显示的所有单细胞免疫分析数据都包含转录组信息和每个细胞严格配对的TCR/BCR链;排除少于30个细胞的数据集。最终,753,385/1,198,179个细胞被丢弃,444,794个hcT/B细胞在huARdb中显示。

克隆型鉴定:使用Scirpy包的pp.ir dist + tl.define clonotypes。CDR3的核苷酸序列用于定义克隆型。只有在VJ和VDJ链上具有相同CDR3核苷酸序列的细胞被定义为相同的克隆型。

数据库搭建

前端:使用HTML5和CSS3,采用Javascript和D3.js框架进行可视化。

后端:数据包含细胞、克隆型、表型信息,使用PostgreSQL数据库管理系统(v2.6.0)获取;使用Python3(v3.7.9)和Javascript进行前后端交互。

数据库部署在Linux CentOS(v8.3.2011)上的Nginx web server(v1.14.1)上。


# linux  # css  # python  # centos  # nginx  # ai 


相关栏目: 【 网站优化151355 】 【 网络推广146373 】 【 网络技术251813 】 【 AI营销90571


相关推荐: 企业在线网站设计制作流程,想建设一个属于自己的企业网站,该如何去做?  网站制作免费,什么网站能看正片电影?  香港服务器部署网站为何提示未备案?  Laravel如何实现本地化和多语言支持?(i18n教程)  Laravel怎么为数据库表字段添加索引以优化查询  微信小程序 HTTPS报错整理常见问题及解决方案  深圳网站制作公司好吗,在深圳找工作哪个网站最好啊?  javascript基本数据类型及类型检测常用方法小结  焦点电影公司作品,电影焦点结局是什么?  高配服务器限时抢购:企业级配置与回收服务一站式优惠方案  mc皮肤壁纸制作器,苹果平板怎么设置自己想要的壁纸我的世界?  Gemini手机端怎么发图片_Gemini手机端发图方法【步骤】  如何选择PHP开源工具快速搭建网站?  Win11怎么设置虚拟桌面 Win11新建多桌面切换操作【技巧】  Laravel Livewire是什么_使用Laravel Livewire构建动态前端界面  Laravel如何实现数据库事务?(DB Facade示例)  ChatGPT怎么生成Excel公式_ChatGPT公式生成方法【指南】  品牌网站制作公司有哪些,买正品品牌一般去哪个网站买?  Laravel如何自定义分页视图?(Pagination示例)  如何在腾讯云服务器上快速搭建个人网站?  Laravel如何使用Facades(门面)及其工作原理_Laravel门面模式与底层机制  利用vue写todolist单页应用  网站页面设计需要考虑到这些问题  米侠浏览器网页背景异常怎么办 米侠显示修复  lovemo网页版地址 lovemo官网手机登录  EditPlus中的正则表达式 实战(2)  香港服务器网站搭建教程-电商部署、配置优化与安全稳定指南  Laravel如何生成PDF或Excel文件_Laravel文档导出工具与使用教程  关于BootStrap modal 在IOS9中不能弹出的解决方法(IOS 9 bootstrap modal ios 9 noticework)  香港服务器如何优化才能显著提升网站加载速度?  微信小程序 五星评分(包括半颗星评分)实例代码  简历在线制作网站免费版,如何创建个人简历?  Laravel如何使用.env文件管理环境变量?(最佳实践)  小视频制作网站有哪些,有什么看国内小视频的网站,求推荐?  JavaScript如何操作视频_媒体API怎么控制播放  JS经典正则表达式笔试题汇总  Laravel如何发送系统通知?(Notification渠道示例)  EditPlus 正则表达式 实战(3)  高端云建站费用究竟需要多少预算?  打开php文件提示内存不足_怎么调整php内存限制【解决方案】  jquery插件bootstrapValidator表单验证详解  太平洋网站制作公司,网络用语太平洋是什么意思?  Laravel如何实现RSS订阅源功能_Laravel动态生成网站XML格式订阅内容【教程】  国美网站制作流程,国美电器蒸汽鍋怎么用官方网站?  JavaScript如何实现错误处理_try...catch如何捕获异常?  香港服务器网站推广:SEO优化与外贸独立站搭建策略  高防服务器租用如何选择配置与防御等级?  Laravel如何处理JSON字段的查询和更新_Laravel JSON列操作与查询技巧  为什么要用作用域操作符_php中访问类常量与静态属性的优势【解答】  Laravel怎么实现验证码(Captcha)功能