Bioinformatics 术语表

由 Excel 自动导出为 HTML 预览版,适合浏览器中查看,不依赖本地表格应用。

Workbook: bioinformatics_glossary.xlsxSheets: 4

核心术语表

生物信息学专业术语对照表 · Bioinformatics Glossary
来源:NCBI MeSH / Gene Ontology / HGNC / 国家科技名词审定委员会 | 版本:2025-03
#英文术语 English Term中文标准译名缩写 Abbr.类别 Category说明 / 使用注意来源 Source备注
1sequence alignment序列比对序列分析分局部比对与全局比对,注意区分 local/globalNCBI
2local alignment局部比对序列分析Smith-Waterman 算法基础NCBI
3global alignment全局比对序列分析Needleman-Wunsch 算法基础NCBI
4pairwise alignment双序列比对序列分析两条序列之间的比对NCBI
5multiple sequence alignment多序列比对MSA序列分析用于系统发育、结构预测NCBI
6gap penalty空位罚分序列分析线性/仿射空位罚分,影响比对质量NCBI
7substitution matrix替换矩阵序列分析BLOSUM62、PAM250 等NCBI
8BLAST基本局部比对搜索工具BLAST序列分析Basic Local Alignment Search Tool,保留英文缩写NCBI
9E-value期望值E值序列分析衡量比对的统计显著性,非 p-valueNCBI
10bit score比特得分序列分析归一化的比对得分NCBI
11query sequence查询序列序列分析待检索序列NCBI
12subject sequence目标序列序列分析数据库中的匹配序列NCBI
13homology同源性序列分析源于共同祖先,区分相似性 similarityMeSH
14ortholog直系同源基因序列分析物种分化产生,功能通常保守NCBI
15paralog旁系同源基因序列分析基因组内复制产生NCBI
16percent identity序列一致性百分比%ID序列分析相同位点占比,不等于同源性NCBI
17consensus sequence共有序列序列分析多序列比对中最常见碱基/氨基酸NCBI
18motif序列模体motif序列分析保留英文亦可,指保守功能模式NCBI
19domain结构域蛋白质结构蛋白质的独立折叠/功能单元Pfam/NCBI
20genome assembly基因组组装基因组学将测序读段重建为完整基因组序列NCBI
21contig重叠群contig基因组学连续无间隙序列,通常保留英文NCBI
22scaffold脚手架序列scaffold基因组学含N填充的更长序列,保留英文亦可NCBI
23N50N50N50基因组学组装质量指标,一半碱基包含在≥N50的片段中NCBI
24read测序读段read测序高通量测序产出的原始序列片段NCBI
25coverage测序深度测序又称覆盖度,基因组每碱基被测序次数NCBI
26paired-end sequencing双端测序PE测序从文库两端测序,提高组装准确性NCBI
27long-read sequencing长读长测序测序PacBio / Oxford Nanopore 技术NCBI
28short-read sequencing短读长测序测序Illumina 为代表,读长100-300 bpNCBI
29reference genome参考基因组基因组学作为比对基准的已知基因组序列NCBI
30variant calling变异检测基因组学从测序数据识别SNP、InDel等变异NCBI
31SNP单核苷酸多态性SNP基因组学Single Nucleotide Polymorphism,保留英文缩写NCBI
32indel插入缺失InDel基因组学Insertion/Deletion,小型序列变异NCBI
33structural variant结构变异SV基因组学大片段插入、缺失、倒位、易位等NCBI
34copy number variation拷贝数变异CNV基因组学基因组区段拷贝数异常NCBI
35annotation注释基因组学为基因组序列添加功能/位置信息NCBI
36gene prediction基因预测基因组学从基因组序列识别编码基因NCBI
37open reading frame开放阅读框ORF基因组学起始/终止密码子间的可编码序列NCBI
38promoter启动子基因组学RNA聚合酶结合位点上游调控区NCBI
39enhancer增强子基因组学顺式作用调控元件,可远距离激活转录NCBI
40transcriptome转录组转录组学细胞/组织某时刻所有RNA的集合NCBI
41RNA-seqRNA测序RNA-seq转录组学高通量转录组测序,保留英文NCBI
42differential expression差异表达DE转录组学不同条件下基因表达量的统计差异NCBI
43read mapping读段比对转录组学将测序读段比对到参考序列NCBI
44transcript转录本转录组学一个基因的一条RNA产物NCBI
45isoform异构体转录组学同一基因不同剪接形式的RNANCBI
46alternative splicing选择性剪接转录组学前体mRNA的不同剪接方式NCBI
47FPKM每百万映射读段中每千碱基的读段数FPKM转录组学Fragments Per Kilobase per Million,表达量单位NCBI
48TPM每百万转录本中每千碱基的转录本数TPM转录组学Transcripts Per Million,推荐替代FPKMNCBI
49count matrix计数矩阵转录组学基因×样本的表达量原始计数表NCBI
50normalization标准化转录组学消除文库大小等批次效应NCBI
51batch effect批次效应转录组学非生物学的技术差异,需校正NCBI
52single-cell RNA-seq单细胞RNA测序scRNA-seq转录组学单个细胞分辨率的转录组分析NCBI
53cell clustering细胞聚类转录组学根据表达谱将细胞分组NCBI
54UMAP均匀流形近似与投影UMAP转录组学降维可视化方法,保留英文缩写UMAP
55t-SNEt-分布随机近邻嵌入t-SNE转录组学降维可视化方法,保留英文缩写NCBI
56proteome蛋白质组蛋白质组学细胞/组织某状态下所有蛋白质NCBI
57mass spectrometry质谱MS蛋白质组学蛋白质组学核心检测技术MeSH
58peptide肽/肽段蛋白质组学短链氨基酸,通常<50个残基NCBI
59protein structure prediction蛋白质结构预测蛋白质结构如 AlphaFold2 实现的计算预测NCBI
60fold蛋白质折叠蛋白质结构特定的三维拓扑结构NCBI
61active site活性位点蛋白质结构酶与底物结合并催化反应的区域MeSH
62binding site结合位点蛋白质结构与配体/底物结合的氨基酸残基MeSH
63secondary structure二级结构蛋白质结构α-螺旋、β-折叠等局部构象NCBI
64tertiary structure三级结构蛋白质结构蛋白质完整三维构象NCBI
65quaternary structure四级结构蛋白质结构多条多肽链的组装方式NCBI
66homology modeling同源建模蛋白质结构基于已知结构的同源蛋白建模NCBI
67molecular docking分子对接蛋白质结构预测小分子与蛋白质的结合构象MeSH
68gene ontology基因本体GO系统生物学Gene Ontology,基因功能描述框架GO
69GO termGO术语GO term系统生物学GO数据库中的功能描述条目GO
70pathway通路系统生物学基因/蛋白质参与的生化/信号反应链KEGG
71KEGG京都基因与基因组百科全书KEGG系统生物学Kyoto Encyclopedia of Genes and GenomesKEGG
72protein-protein interaction蛋白质-蛋白质相互作用PPI系统生物学蛋白质间的功能相互作用STRING
73network网络系统生物学节点(基因/蛋白)与边(相互作用)构成的图NCBI
74hub gene核心基因系统生物学网络中度值最高的关键节点基因NCBI
75enrichment analysis富集分析系统生物学检验基因集在特定功能/通路中的过表示GO/KEGG
76false discovery rate错误发现率FDR统计多重检验校正方法,优于 Bonferroni统计
77p-valuep值p统计统计显著性指标,需配合效应量解释统计
78feature extraction特征提取机器学习从原始序列/结构提取有效特征ML
79dimensionality reduction降维机器学习PCA、UMAP、t-SNE等ML
80principal component analysis主成分分析PCA机器学习线性降维方法ML
81clustering聚类机器学习无监督分组,如 k-means、层次聚类ML
82classification分类机器学习有监督预测类别标签ML
83cross-validation交叉验证CV机器学习模型评估方法,避免过拟合ML
84overfitting过拟合机器学习模型对训练数据过度拟合ML
85neural network神经网络NN深度学习模拟神经元连接的计算模型ML
86convolutional neural network卷积神经网络CNN深度学习序列/图像特征提取ML
87transformer变换器Transformer深度学习自注意力机制,蛋白质语言模型基础ML
88language model语言模型LM深度学习如 ESM2、ProtTrans 用于蛋白质序列ML
89embedding嵌入/向量表示深度学习序列/蛋白质的低维向量表示ML
90GenBankGenBank核苷酸数据库GenBank数据库NCBI核心核苷酸序列数据库NCBI
91UniProtUniProt蛋白质数据库UniProt数据库含 Swiss-Prot(手动注释)和 TrEMBLUniProt
92PDB蛋白质数据银行PDB数据库Protein Data Bank,三维结构存储RCSB
93EnsemblEnsembl基因组数据库Ensembl数据库欧洲生物信息研究所基因组注释EBI
94SRA序列读取存档SRA数据库Sequence Read Archive,原始测序数据NCBI
95GEO基因表达综合数据库GEO数据库Gene Expression Omnibus,表达数据NCBI
96BWABurrows-Wheeler比对工具BWA工具短读长比对到参考基因组工具
97STAR剪接转录本比对工具STAR工具RNA-seq读段比对,处理剪接位点工具
98SAMtoolsSAM格式工具集SAMtools工具处理 SAM/BAM 格式比对文件工具
99GATK基因组分析工具包GATK工具Genome Analysis Toolkit,变异检测标准流程Broad
100DESeq2差异表达分析工具DESeq2工具R包,基于负二项分布Bioconductor
101edgeR边缘R差异表达工具edgeR工具R包,RNA-seq差异分析Bioconductor
102SeuratSeurat单细胞分析包Seurat工具R包,scRNA-seq分析主流工具Satija Lab
103ScanpyScanpy单细胞分析包Scanpy工具Python包,scRNA-seq分析Theis Lab
104AlphaFoldAlphaFold蛋白质结构预测AF2工具DeepMind 开发的结构预测工具DeepMind
105epigenome表观基因组表观遗传学所有表观遗传修饰的总和NCBI
106ChIP-seq染色质免疫沉淀测序ChIP-seq表观遗传学检测蛋白质-DNA结合位点NCBI
107ATAC-seq转座酶可及染色质测序ATAC-seq表观遗传学检测开放染色质区域NCBI
108DNA methylationDNA甲基化表观遗传学CpG位点甲基化,影响基因表达NCBI
109histone modification组蛋白修饰表观遗传学H3K4me3、H3K27ac等NCBI
110chromatin accessibility染色质可及性表观遗传学染色质开放程度,影响转录因子结合NCBI
111peak calling峰值检测表观遗传学从ChIP/ATAC-seq数据识别富集区域NCBI
112biological sequence database生物序列数据库数据库本书第1章标题术语;可简称“序列数据库”。Bioinformatics 4e Ch12026-05-11 Ch1 Introduction
113nucleotide base核苷酸碱基分子生物学注意与 nucleotide sequence 区分。Bioinformatics 4e Ch12026-05-11 Ch1 Introduction
114sequence data序列数据序列分析泛指 DNA/RNA/蛋白质等序列数据。Bioinformatics 4e Ch12026-05-11 Ch1 Introduction
115annotated sequence database带注释的序列数据库数据库annotated 在数据库语境中统一译为“带注释的”。Bioinformatics 4e Ch12026-05-11 Ch1 Introduction
116Protein Information Resource蛋白质信息资源PIR数据库机构/数据库名首次出现可译名+英文缩写,后续保留 PIR。Bioinformatics 4e Ch12026-05-11 Ch1 Introduction
117European Molecular Biology Laboratory欧洲分子生物学实验室EMBL机构机构名首次出现可中文+英文缩写。Bioinformatics 4e Ch12026-05-11 Ch1 Introduction
118DNA Databank of Japan日本 DNA 数据库DDBJ数据库数据库名首次出现可中文+英文缩写,后续保留 DDBJ。Bioinformatics 4e Ch12026-05-11 Ch1 Introduction
119International Nucleotide Sequence Database Collaboration国际核苷酸序列数据库协作组织INSDC数据库联盟核心数据库联盟术语。Bioinformatics 4e Ch12026-05-11 Ch1 Introduction
120European Nucleotide Archive欧洲核苷酸档案库ENA数据库数据库名首次出现可中文+英文缩写,后续保留 ENA。Bioinformatics 4e Ch12026-05-11 Ch1 Introduction
121Swiss-ProtSwiss-Prot数据库数据库名保留英文。Bioinformatics 4e Ch12026-05-11 Ch1 Introduction
122TrEMBLTrEMBL数据库保留英文;首次出现解释为 translation of EMBL nucleotide sequences。Bioinformatics 4e Ch12026-05-11 Ch1 Introduction
123coding sequence编码序列CDS分子生物学复数 coding sequences 可译“编码序列”。Bioinformatics 4e Ch12026-05-11 Ch1 Introduction
124UniProt KnowledgebaseUniProt 知识库UniProtKB数据库保留 UniProtKB 缩写。Bioinformatics 4e Ch12026-05-11 Ch1 Introduction
125model genome模式生物基因组基因组学本句中 numerous model genomes 指众多模式生物基因组。Bioinformatics 4e Ch12026-05-11 Ch1 Introduction
126bioinformatic analysis生物信息学分析通用形容词 bioinformatic 统一译为“生物信息学的/生物信息学”。Bioinformatics 4e Ch12026-05-11 Ch1 Introduction
127curator人工审查人员数据库数据库维护语境使用;不用“策展人员”。Bioinformatics 4e Ch12026-05-11 用户确认译法;中文习惯优化
128curation人工审查数据库数据库条目维护语境使用;不用“策展”。Bioinformatics 4e Ch12026-05-11 用户确认译法;中文习惯优化
129book of life生命之书概念表述隐喻表达;按中文习惯译为“生命之书”。Bioinformatics 4e Ch12026-05-11 用户确认译法
130nucleotide sequence data核苷酸序列数据序列分析指核苷酸层面的序列数据。Bioinformatics 4e Ch12026-05-11 Ch1 Nucleotide Sequence Databases
131common data format共同的数据格式数据库用于数据库间数据交换。Bioinformatics 4e Ch12026-05-11 Ch1 Nucleotide Sequence Databases
132flatfileflatfile / 平面文件文件格式本书数据库记录格式术语;首次可写“称为 flatfile 的文本文件”。Bioinformatics 4e Ch12026-05-11 Ch1 Nucleotide Sequence Databases
133sequence record序列记录数据库数据库中的单条序列条目。Bioinformatics 4e Ch12026-05-11 Ch1 Nucleotide Sequence Databases
134tag标签数据结构与 identifier 区分;基础标记信息。Bioinformatics 4e Ch12026-05-11 Ch1 Nucleotide Sequence Databases
135identifier标识符ID数据结构用于唯一或基本识别记录。Bioinformatics 4e Ch12026-05-11 Ch1 Nucleotide Sequence Databases
136FASTA formatFASTA 格式FASTA文件格式注意 FASTA 可指格式,也可指软件套件,按上下文区分。Bioinformatics 4e Ch12026-05-11 Ch1 Nucleotide Sequence Databases
137FASTA software suiteFASTA 软件套件FASTA工具与 FASTA 格式区分。Bioinformatics 4e Ch12026-05-11 Ch1 Nucleotide Sequence Databases
138primary data原始数据数据类型此处指未经复杂加工的基本序列数据。Bioinformatics 4e Ch12026-05-11 Ch1 Nucleotide Sequence Databases
139definition line定义行def line文件格式FASTA 记录中以 > 开头的说明行。Bioinformatics 4e Ch12026-05-11 Ch1 Nucleotide Sequence Databases
140accession.version numberaccession.version 编号数据库登录号与版本号组合;可保留英文格式。Bioinformatics 4e Ch12026-05-11 Ch1 Nucleotide Sequence Databases
141accession number登录号数据库论文引用序列时应使用的稳定编号。Bioinformatics 4e Ch12026-05-11 Ch1 Nucleotide Sequence Databases
142version number suffix版本号后缀数据库用于判断序列记录版本。Bioinformatics 4e Ch12026-05-11 Ch1 Nucleotide Sequence Databases
143source database来源数据库数据库记录来源数据库,如 ENA。Bioinformatics 4e Ch12026-05-11 Ch1 Nucleotide Sequence Databases
144biological entity生物学实体生物学序列所代表的对象。Bioinformatics 4e Ch12026-05-11 Ch1 Nucleotide Sequence Databases
145elementary unit of information信息的基本单位数据库描述 flatfile 在序列数据库中的角色。Bioinformatics 4e Ch12026-05-11 Ch1 Flatfiles
146field字段数据结构flatfile 中单个信息项。Bioinformatics 4e Ch12026-05-11 Ch1 Flatfiles
147header头部数据库记录包含整条记录相关信息和描述符。Bioinformatics 4e Ch12026-05-11 Ch1 Flatfiles
148descriptor描述符数据库记录用于描述整条记录的信息。Bioinformatics 4e Ch12026-05-11 Ch1 Flatfiles
149feature table特征表数据库记录提供与序列相关的注释。Bioinformatics 4e Ch12026-05-11 Ch1 Flatfiles
150database-specific数据库特异性的数据库描述 header 最能体现数据库格式差异。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
151ID lineID 行ID数据库记录ENA 中记录基本识别信息的行。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
152LOCUS lineLOCUS 行LOCUS数据库记录DDBJ/GenBank 中对应 ENA ID 行。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
153sequence version序列版本SV数据库与 accession.version 中的版本概念相关但不完全等同。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
154topology拓扑结构分子属性如 linear。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
155molecule type分子类型分子属性如 genomic DNA。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
156data class数据类别数据库ENA 对功能分区类型的称呼。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
157functional division功能分区数据库用于按功能类型组织序列记录。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
158taxonomic division分类分区分类学如 INV 表示无脊椎动物。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
159base pair碱基对bp分子生物学长度单位;复数 base pairs。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
160AC lineAC 行AC数据库记录显示登录号的行。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
161Constructed record构建记录CON数据库分区CON 分区;可保留 contigged 说明。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
162Expressed Sequence Tag表达序列标签EST数据库分区短 cDNA 单次读段;表达快照。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
163Genome Survey Sequence基因组调查序列GSS数据库分区基因组来源的调查序列。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
164High-Throughput Genome sequence高通量基因组序列HTG数据库分区高通量测序中心产生的未完成 DNA 序列。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
165Sequence-Tagged Site序列标签位点STS数据库分区PCR 实验相关的操作上唯一短序列。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
166Whole-Genome Shotgun sequence全基因组鸟枪法序列WGS数据库分区鸟枪法项目产生的大量短读段数据。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
167date line日期行DT数据库记录说明条目创建或更新日期。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
168release number发布版本号数据库指季度发布版本。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
169OS lineOS 行OS数据库记录ENA 中来源物种科学名称行。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
170OC lineOC 行OC数据库记录ENA 中完整分类信息行。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
171reference block参考信息块数据库记录记录参考文献或提交信息。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
172database cross-reference数据库交叉引用DR数据库记录链接到关联数据库。Bioinformatics 4e Ch12026-05-11 Ch1 The Header
173feature key特征键数据库记录feature table 的组成之一。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
174location information位置信息数据库记录feature table 的组成之一。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
175qualifier限定符数据库记录feature table 的补充描述字段。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
176source featuresource feature / 来源特征数据库记录feature table 中标记序列生物学来源的首个 feature。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
177gene featuregene feature / 基因特征数据库记录表示基因本身在整条序列中的位置。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
178mRNA featuremRNA feature数据库记录表示成熟 mRNA 转录本区域。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
179CDS featureCDS feature数据库记录表示编码序列区域。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
180source keysource key数据库记录source feature 对应的 key 名。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
181organism生物体生物学/organism 限定符所用字段。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
182chromosome染色体染色体/chromosome 限定符。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
183map图谱位置遗传图谱/map 限定符。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
184molecular type分子类型mol_type分子属性/mol_type 限定符。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
185database cross-reference qualifier数据库交叉引用限定符db_xref数据库记录feature table 中的受控交叉引用。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
186join linejoin 行join数据库记录表示多个区段连接。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
187codon_startcodon_startcodon_start翻译表示翻译起始偏移。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
188protein_idprotein_idprotein_id蛋白质蛋白质数据库对应条目的登录号。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
189translation qualifiertranslation 限定符translation翻译CDS 翻译后的氨基酸序列。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
190untranslated region非翻译区UTR分子生物学5′ 和 3′ UTR。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
191sequence length序列长度序列属性SQ 行中给出。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
192GC contentGC 含量序列属性由碱基计数可计算。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
193graphical interface图形界面可视化用于辅助解释 flatfile。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
194RefSeqRefSeq数据库NCBI 的参考序列项目。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
195non-redundant非冗余的数据库RefSeq 的重要特征。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
196biocuration人工审查数据库数据库专家对原始数据的人工增强。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
197interoperability互操作性标准化序列数据库标准的重要目标。Bioinformatics 4e Ch12026-05-11 Ch1 The Feature Table
198graphical view图形视图可视化用于展示数据库记录中的生物学特征。Bioinformatics 4e Ch12026-05-11 Ch1 Graphical Interfaces
199documented biological feature已记录的生物学特征数据库记录feature table 中文档化的特征。Bioinformatics 4e Ch12026-05-11 Ch1 Graphical Interfaces
200tracktrack / 轨道基因组浏览图形视图中显示基因、mRNA、CDS 等位置的轨道。Bioinformatics 4e Ch12026-05-11 Ch1 Graphical Interfaces
201coding region编码区CDS分子生物学图形视图中标记为 CDS 的区域。Bioinformatics 4e Ch12026-05-11 Ch1 Graphical Interfaces
202Entrez discovery pathwayEntrez 发现路径NCBINCBI Entrez 中的信息发现路径。Bioinformatics 4e Ch12026-05-11 Ch1 Graphical Interfaces
203central dogma中心法则分子生物学DNA、RNA、蛋白质三者关系的基础概念。Bioinformatics 4e Ch12026-05-11 Ch1 RefSeq
204reference sequence参考序列RefSeq数据库RefSeq 的目标产物。Bioinformatics 4e Ch12026-05-11 Ch1 RefSeq
205non-redundant set非冗余集合数据库RefSeq 项目的重要特征。Bioinformatics 4e Ch12026-05-11 Ch1 RefSeq
206ongoing curation持续人工审查数据库RefSeq 条目的持续更新和审查。Bioinformatics 4e Ch12026-05-11 Ch1 RefSeq
207accession number series登录号系列数据库RefSeq 使用独立编号系列。Bioinformatics 4e Ch12026-05-11 Ch1 RefSeq
208experimentally determined sequence实验测定序列N-type数据库对应 N 编号序列。Bioinformatics 4e Ch12026-05-11 Ch1 RefSeq
209computational prediction计算预测X-type数据库对应 X 编号序列。Bioinformatics 4e Ch12026-05-11 Ch1 RefSeq
210genome annotation基因组注释基因组学RefSeq 中的模型序列来源。Bioinformatics 4e Ch12026-05-11 Ch1 RefSeq
211RefSeq web siteRefSeq 网站网站NCBI RefSeq 官网。Bioinformatics 4e Ch12026-05-11 Ch1 RefSeq
212protein sequence database蛋白质序列数据库数据库存储蛋白质序列数据的数据库。Bioinformatics 4e Ch12026-05-11 Ch1 Protein Sequence Databases
213prokaryote原核生物生物分类与 eukaryote 相对。Bioinformatics 4e Ch12026-05-11 Ch1 Protein Sequence Databases
214eukaryote真核生物生物分类与 prokaryote 相对。Bioinformatics 4e Ch12026-05-11 Ch1 Protein Sequence Databases
215functional analysis功能分析蛋白质组学分析蛋白质功能。Bioinformatics 4e Ch12026-05-11 Ch1 Protein Sequence Databases
216proteomic method蛋白质组学方法蛋白质组学第11章相关。Bioinformatics 4e Ch12026-05-11 Ch1 Protein Sequence Databases
217protein structure analysis蛋白质结构分析结构生物学第12章相关。Bioinformatics 4e Ch12026-05-11 Ch1 Protein Sequence Databases
218biological activity生物学活性生物学蛋白功能分析内容之一。Bioinformatics 4e Ch12026-05-11 Ch1 Protein Sequence Databases
219information space信息空间概念表述原文引号表达,保留概念性译法。Bioinformatics 4e Ch12026-05-11 Ch1 Protein Sequence Databases
220secondary database二级数据库数据库由其他数据库/序列翻译派生的数据资源。Bioinformatics 4e Ch12026-05-11 Ch1 Protein Sequence Databases
221universal protein sequence database通用蛋白质序列数据库数据库覆盖所有物种蛋白质的数据库。Bioinformatics 4e Ch12026-05-11 Ch1 Protein Sequence Databases
222specialized protein sequence database专门的蛋白质序列数据库数据库聚焦特定家族/群体/生物体的数据库。Bioinformatics 4e Ch12026-05-11 Ch1 Protein Sequence Databases
223model organism database模式生物数据库数据库如 MGD、WormBase。Bioinformatics 4e Ch12026-05-11 Ch1 Protein Sequence Databases
224sequence repository序列库数据库很少或没有人工干预的数据存储库。Bioinformatics 4e Ch12026-05-11 Ch1 Protein Sequence Databases
225curated database人工审查数据库数据库由专家进行人工审查增强的数据资源。Bioinformatics 4e Ch12026-05-11 Ch1 Protein Sequence Databases
226best practice最佳实践标准化准确表示生物学知识的实践。Bioinformatics 4e Ch12026-05-11 Ch1 Protein Sequence Databases
227International Society for BiocurationInternational Society for BiocurationISB组织组织名保留英文;使命是推进 biocuration 原则。Bioinformatics 4e Ch12026-05-11 Ch1 Protein Sequence Databases
228protein database蛋白质数据库数据库NCBI 维护的蛋白质数据库。Bioinformatics 4e Ch12026-05-11 Ch1 The NCBI Protein Database
229Third Party Annotation第三方注释TPA数据库NCBI 的补充注释数据库。Bioinformatics 4e Ch12026-05-11 Ch1 The NCBI Protein Database
230TPA datasetTPA 数据集TPA数据库Third Party Annotation 数据集。Bioinformatics 4e Ch12026-05-11 Ch1 The NCBI Protein Database
231original submitter原始提交者数据库INSDC 条目的原始提交人。Bioinformatics 4e Ch12026-05-11 Ch1 The NCBI Protein Database
232Protein Research FoundationProtein Research Foundation机构保留英文机构名。Bioinformatics 4e Ch12026-05-11 Ch1 The NCBI Protein Database
233data repository数据仓库数据库科学家快速访问序列数据的资源。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
234UniProt ConsortiumUniProt Consortium数据库联盟保留英文名。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
235UniProt ArchiveUniProt ArchiveUniParc数据库所有公开蛋白质序列的非冗余集合。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
236UniProt Reference ClustersUniProt 参考聚类UniRef数据库按序列一致性聚类的非冗余视图。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
237sequence identity序列一致性序列分析UniRef 聚类水平。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
238heterogeneous nuclear ribonuclear protein A1异质性核核糖核蛋白 A1hnRNP A1蛋白质原文术语疑似应为 heterogeneous nuclear ribonucleoprotein A1;保留英文核对。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
239manual review人工审查数据库UniProtKB 条目审查状态。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
240experimental evidence实验证据证据类型支持蛋白存在。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
241Gene Ontology termGene Ontology 术语GO term本体与条目相关联的 GO 术语。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
242Subcellular location亚细胞定位蛋白质注释UniProtKB 条目部分。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
243color-coded schematic颜色编码示意图可视化图形界面中的细胞示意图。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
244Feature viewerFeature viewer / 特征查看器可视化UniProtKB 中按坐标显示特征的视图。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
245post-translational modification翻译后修饰PTM蛋白质修饰蛋白质翻译后修饰。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
246modified residue修饰残基蛋白质修饰PTM 中被修饰的氨基酸残基。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
247Structural features结构特征蛋白质结构UniProtKB Feature viewer 部分。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
248Variants变体变异UniProtKB Feature viewer 部分。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
249alpha helixα 螺旋蛋白质结构蛋白质二级结构。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
250beta strandβ 链蛋白质结构蛋白质二级结构。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
251beta turnβ 转角蛋白质结构蛋白质二级结构。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
252point mutation点突变变异单个位点突变。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
253proline-to-leucine variant脯氨酸到亮氨酸变体变异蛋白质氨基酸替换。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
254relapsing-remitting multiple sclerosis复发缓解型多发性硬化RRMS疾病疾病名。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
255disease-causing variant致病变体变异已知或预测造成疾病的变体。Bioinformatics 4e Ch12026-05-11 Ch1 UniProt
256genomic arena基因组学领域领域Summary 中与 proteomic arena 并列。Bioinformatics 4e Ch12026-05-12 Ch1 Summary + Box 1.3
257proteomic arena蛋白质组学领域领域Summary 中与 genomic arena 并列。Bioinformatics 4e Ch12026-05-12 Ch1 Summary + Box 1.3
258data storage数据存储数据库数据库基本功能之一。Bioinformatics 4e Ch12026-05-12 Ch1 Summary + Box 1.3
259information retrieval信息检索数据库数据库高效使用的关键能力。Bioinformatics 4e Ch12026-05-12 Ch1 Summary + Box 1.3
260biological community生物学界社群数据库质量维护依赖的使用者与提交者群体。Bioinformatics 4e Ch12026-05-12 Ch1 Summary + Box 1.3
261database administrator数据库管理员数据库负责跟进错误报告和数据库维护。Bioinformatics 4e Ch12026-05-12 Ch1 Summary + Box 1.3
262designee指定人员数据库可代表原提交者更新记录的人。Bioinformatics 4e Ch12026-05-12 Ch1 Summary + Box 1.3
263full-length mRNA全长 mRNA分子生物学Box 1.3 错误示例。Bioinformatics 4e Ch12026-05-12 Ch1 Summary + Box 1.3
264public sequence database公共序列数据库数据库公开序列资源。Bioinformatics 4e Ch12026-05-12 Ch1 Summary + Box 1.3
265specialized database专业数据库数据库面向特定生物学群体或特定数据类型的小型数据库。Bioinformatics 4e Ch12026-05-12 Ch1 Summary + Box 1.3
266strain cross品系杂交遗传学专业数据库可能包含的数据类型。Bioinformatics 4e Ch12026-05-12 Ch1 Summary + Box 1.3
267gene expression data基因表达数据组学数据专业数据库可能包含的数据类型。Bioinformatics 4e Ch12026-05-12 Ch1 Summary + Box 1.3
268Database issueDatabase 专刊期刊栏目Nucleic Acids Research 每年数据库专刊。Bioinformatics 4e Ch12026-05-12 Ch1 Summary + Box 1.3
269robust bioinformatic analysis稳健的生物信息学分析分析本章总结中的能力目标。Bioinformatics 4e Ch12026-05-12 Ch1 Summary + Box 1.3
270Acknowledgments致谢章节结构章节末尾致谢标题。Bioinformatics 4e Ch12026-05-12 Ch1 Acknowledgments + Internet Resources
271Internet Resources互联网资源章节结构章节末尾资源列表标题。Bioinformatics 4e Ch12026-05-12 Ch1 Acknowledgments + Internet Resources
272DDBJ Database DivisionsDDBJ 数据库分部数据库资源DDBJ 数据库分类资源。Bioinformatics 4e Ch12026-05-12 Ch1 Acknowledgments + Internet Resources
273EMBL Nucleotide Sequence DatabaseEMBL 核苷酸序列数据库数据库资源EMBL 序列数据库资源。Bioinformatics 4e Ch12026-05-12 Ch1 Acknowledgments + Internet Resources
274ENA Data FormatsENA 数据格式数据库资源ENA 提交数据格式资源。Bioinformatics 4e Ch12026-05-12 Ch1 Acknowledgments + Internet Resources
275European Bioinformatics Institute欧洲生物信息学研究所EBI机构EBI 机构名。Bioinformatics 4e Ch12026-05-12 Ch1 Acknowledgments + Internet Resources
276GenBank Database DivisionsGenBank 数据库分部数据库资源GenBank 分类资源。Bioinformatics 4e Ch12026-05-12 Ch1 Acknowledgments + Internet Resources
277INSDC Feature Table DefinitionINSDC Feature Table 定义数据库资源INSDC 特征表定义。Bioinformatics 4e Ch12026-05-12 Ch1 Acknowledgments + Internet Resources
278NCBI Data ModelNCBI 数据模型数据库资源NCBI 数据模型文档。Bioinformatics 4e Ch12026-05-12 Ch1 Acknowledgments + Internet Resources
279Further Reading延伸阅读章节结构章节末尾推荐阅读标题。Bioinformatics 4e Ch12026-05-12 Ch1 Further Reading
280bioinformatics landscape生物信息学格局领域描述现代生物信息学发展背景。Bioinformatics 4e Ch12026-05-12 Ch1 Further Reading
281DNA sequencing methodologyDNA 测序方法测序进一步阅读中讨论的技术方法。Bioinformatics 4e Ch12026-05-12 Ch1 Further Reading
282data sharing数据共享数据库测序应用引出的数据治理问题。Bioinformatics 4e Ch12026-05-12 Ch1 Further Reading
283molecular biology database collection分子生物学数据库集数据库资源NAR 数据库概览标题中的术语。Bioinformatics 4e Ch12026-05-12 Ch1 Further Reading
284bioinformatic database生物信息学数据库数据库公开可用的数据库资源类型。Bioinformatics 4e Ch12026-05-12 Ch1 Further Reading
genome sequencing基因组测序Ch2 Introduction
GenBankGenBankCh2 Introduction (保留原名)
National Center for Biotechnology Information美国国立生物技术信息中心Ch2 IntroductionNCBI
NCBINCBICh2 Introduction (保留缩写)
National Institutes of Health美国国立卫生研究院Ch2 IntroductionNIH
NIHNIHCh2 Introduction (保留缩写)
European Molecular Biology Laboratory欧洲分子生物学实验室Ch2 IntroductionEMBL
EMBLEMBLCh2 Introduction (保留缩写)
DNA Data Bank of Japan日本 DNA 数据库Ch2 IntroductionDDBJ
DDBJDDBJCh2 Introduction (保留缩写)
nucleotide核苷酸Ch2 Introduction
sequence序列Ch2 Introduction
Human Genome Project人类基因组计划Ch2 Introduction
information space信息空间Ch2 Introduction
EntrezEntrezCh2 Introduction (保留原名)
integrated information retrieval综合信息检索Ch2 Introduction
exponential growth指数增长Ch2 Introduction
bioinformatics生物信息学Ch2 Introduction
sequence variation序列变异Ch2 Introduction
model organism模式生物Ch2 Introduction
database数据库Ch2 Introduction
retrieval检索Ch2 Introduction
neighboring (neighbors)邻近关系数据库条目关联方式
hard links硬链接数据库间条目连接
VAST+VAST+Vector Alignment Search Tool增强版
Weighted Key Terms加权关键词项Entrez文本相似性方法
relevance pairs model相关对检索模型Entrez文本检索算法
Discovery ColumnDiscovery ColumnNCBI界面元素
iCn3DiCn3DNCBI 3D结构查看器
biological unit生物单元VAST+术语
netrin-1 receptornetrin-1受体DCC基因编码蛋白质
DCCDCCdeleted in colorectal carcinoma
dbSNPdbSNPDatabase of Single Nucleotide Polymorphisms
dbVARdbVARDatabase of Genomic Structural Variation
Monte Carlo methods蒙特卡罗方法随机搜索优化算法
RMSDRMSDRoot-mean-square deviation
author field作者字段PubMed检索字段
Boolean operators布尔运算符AND/OR/NOT
field delimiters / tags字段限定符搜索语句中的[AUTH]等
Related articles相关文章PubMed相似文献推荐
non-synonymous SNP非同义SNP产生氨基酸改变的SNP
synonymous SNP同义SNP不改变氨基酸的SNP
allelic variant等位基因变异allelic variant listed in OMIM entries
mirror movements镜像运动phenotype term in OMIM example
physician-scientists医师科学家clinician-researchers interested in genetic disorders
colorectal neoplasms结直肠肿瘤ClinicalTrials.gov disease term
specialized genomic databases专业基因组数据库数据库类型服务于特定研究群体的专业化基因组数据库NCBI
NCBI datamodelNCBI 数据模型概念/模型NCBI 用于组织数据的结构化模型NCBI
value-added databases增值数据库数据库类型在原始数据基础上增加了人工注释或额外信息的数据库,区别于普通数据库NCBI
Jackson Laboratory杰克逊实验室机构位于缅因州巴尔港(Bar Harbor),MGD 和 MGI 的主办机构NCBI
Bar Harbor巴尔港地点缅因州城镇,Jackson Laboratory 所在地NCBI
physical mapping data物理图谱数据图谱学基于克隆和序列的图谱数据,区别于遗传图谱和细胞遗传学图谱NCBI
transgenic constructs转基因构建分子生物学人工构建的含有转基因序列的 DNA 分子NCBI
Alliance of Genome Resources基因组资源联盟机构模式生物数据库协作组织,提供跨资源中央门户,建议保留英文NCBI
central portals中央门户网络资源集中提供多个数据库检索访问的门户网站NCBI
free-text searches自由文本搜索检索方式使用任意自然语言词汇进行搜索,区别于结构化检索NCBI
sequence targeting reagents序列靶向试剂实验材料用于靶向特定 DNA 序列的实验试剂(如 CRISPR、morpholinos)NCBI
dccdcc基因名斑马鱼基因名,小写斜体 *dcc*,人类直系同源基因为 DCC(大写)NCBI
343similarity相似性序列分析定量指标,基于可观察的序列比对结果;注意区分 homologyBioinformatics 4e Ch3
344orthologous直系同源的序列分析形容词;由物种分化事件分隔的基因关系Bioinformatics 4e Ch3
345paralogous旁系同源的序列分析形容词;由同一物种内基因复制事件分隔的基因关系Bioinformatics 4e Ch3
346structural motif结构基序蛋白质结构序列或结构中可识别的功能/结构模式Bioinformatics 4e Ch3
347conserved residue保守残基序列分析进化中保持不变或高度保守、通常对结构或功能重要的残基Bioinformatics 4e Ch3
348conserved position保守位置序列分析多条序列比对中保持不变或高度保守的位置Bioinformatics 4e Ch3
349subsequence子序列序列分析序列中的连续片段;局部比对常关注高相似性子序列Bioinformatics 4e Ch3
350global sequence alignment method全局序列比对方法序列分析在两条序列全长范围内寻找最佳比对的方法Bioinformatics 4e Ch3
351local sequence alignment method局部序列比对方法序列分析寻找两条序列中最相似局部区域的方法Bioinformatics 4e Ch3
352scoring matrix评分矩阵序列分析序列比对中的经验性加权方案,用于评估比对质量Bioinformatics 4e Ch3
353conservative amino acid substitution保守性氨基酸替换序列分析物理化学性质相似的氨基酸之间的替换,通常对功能影响较小Bioinformatics 4e Ch3
354odds ratio优势比统计学评分矩阵中用于比较观察替换频率与随机替换频率的比值Bioinformatics 4e Ch3
355log odds ratio对数优势比统计学优势比取对数后得到的分数形式,评分矩阵中的数值基础Bioinformatics 4e Ch3
356lod scorelod 分数LOD统计学log odds score;观察频率与随机频率比值的对数Bioinformatics 4e Ch3
357PAM matrixPAM 矩阵PAM序列分析基于 point accepted mutation 的蛋白质替换评分矩阵Bioinformatics 4e Ch3
358point accepted mutation可接受点突变PAM进化分析通过自然选择被容纳且保持相同或相似功能的点突变Bioinformatics 4e Ch3
359BLOSUM matrixBLOSUM 矩阵BLOSUM序列分析基于保守区块替换模式直接计算得到的蛋白质评分矩阵Bioinformatics 4e Ch3
360blocks substitution matrix区块替换矩阵BLOSUM序列分析BLOSUM 的全称;基于蛋白质 block 中替换模式构建Bioinformatics 4e Ch3
361blockblock / 区块序列分析同一家族蛋白质中可无缺口比对的保守基序集合;指比对本身Bioinformatics 4e Ch3
362acceptance接受进化分析PAM 语境中指可被自然选择容纳、仍保持相同或相似功能的变化Bioinformatics 4e Ch3
363substitution pattern替换模式序列分析序列进化或比对中氨基酸/核苷酸彼此替换的规律Bioinformatics 4e Ch3
364nucleotide scoring matrix核苷酸评分矩阵序列分析核苷酸序列比对使用的评分矩阵,通常统计匹配与错配Bioinformatics 4e Ch3
365mismatch错配序列分析比对位置上两个字符不同;与 match 区分Bioinformatics 4e Ch3
366protein-based search基于蛋白质的搜索序列检索将编码 DNA 转为蛋白质层面检索;信息量通常高于核苷酸搜索Bioinformatics 4e Ch3
367nucleotide-based search基于核苷酸的搜索序列检索直接在核苷酸层面进行搜索或比对Bioinformatics 4e Ch3
368amino acid alphabet氨基酸字母表序列分析20 个氨基酸字符构成,信息量高于四字母核苷酸字母表Bioinformatics 4e Ch3
369nucleotide alphabet核苷酸字母表序列分析A/C/G/T 四个核苷酸字符构成Bioinformatics 4e Ch3
370gap缺口序列比对为补偿插入或缺失而在比对中引入的空位Bioinformatics 4e Ch3
371affine gap penalty仿射缺口罚分序列比对由缺口开启罚分和与缺口长度成比例的延伸罚分构成Bioinformatics 4e Ch3
372gap-opening penalty缺口开启罚分G序列比对创建一个新缺口的固定代价Bioinformatics 4e Ch3
373gap-extension penalty缺口延伸罚分L序列比对延长已有缺口的单位长度代价Bioinformatics 4e Ch3
374linear gap penalty线性缺口罚分序列比对非仿射缺口罚分;每个缺口位置施加固定罚分,无开启代价Bioinformatics 4e Ch3
375mismatch penalty错配罚分序列比对对错配位置施加的固定扣分;线性缺口罚分中也用于每个缺口位置Bioinformatics 4e Ch3
376Basic Local Alignment Search Tool基本局部比对搜索工具BLAST序列比对BLAST 的英文全称Bioinformatics 4e Ch3
377sensitivity敏感性序列比对检测真实相似性或同源关系的能力Bioinformatics 4e Ch3
378pairwise sequence comparison双序列比较序列比对两条序列之间的比较分析Bioinformatics 4e Ch3
379local alignment method局部比对方法序列比对检测序列局部相似区域的方法Bioinformatics 4e Ch3
380target sequence目标序列序列比对被查询序列搜索或比对的序列Bioinformatics 4e Ch3
381query word查询词序列比对从查询序列取出的固定长度短片段,用作 BLAST 搜索种子Bioinformatics 4e Ch3
382neighborhood邻域序列比对与原始查询词按评分矩阵判定为相关的一组词Bioinformatics 4e Ch3
383conservative substitution保守替换序列比对性质相近残基之间的替换,常保留一定生物学相关性Bioinformatics 4e Ch3
384neighborhood score threshold邻域得分阈值T序列比对控制 BLAST 邻域词进入下一步的得分截断参数Bioinformatics 4e Ch3
385cumulative score累计得分序列比对比对延伸过程中逐位置得分的累计总和Bioinformatics 4e Ch3
386score threshold得分阈值S序列比对BLAST 输出中返回命中所需的最低得分Bioinformatics 4e Ch3
387significance decay显著性衰减阈值X序列比对控制 BLAST 延伸终止的得分下降阈值Bioinformatics 4e Ch3
388high-scoring segment pair高得分片段对HSP序列比对BLAST 中得分较高的局部比对片段对Bioinformatics 4e Ch3
389expectation value期望值E-value序列比对随机机会下预期出现同等或更高得分 HSP 的数量Bioinformatics 4e Ch3
390false positive假阳性统计/序列比对被报告为命中但并非真实生物学相关的结果Bioinformatics 4e Ch3
391Karlin-Altschul equationKarlin–Altschul 方程序列比对统计用于计算 BLAST 期望值 E 的局部比对统计方程Bioinformatics 4e Ch3
392BLAST home pageBLAST 主页序列分析NCBI BLAST 搜索入口;界面术语可保留英文Ch3 Performing a BLAST Search
393query subrangequery subrange界面元素BLAST 界面字段名,保留英文Ch3 Performing a BLAST Search
394expect thresholdexpect thresholdBLAST 参数限制返回结果 E 值阈值;界面字段保留英文Ch3 Performing a BLAST Search
395word sizeword sizeBLAST 参数启动 BLAST 搜索的查询词长度;参数名保留英文Ch3 Performing a BLAST Search
396low-complexity region低复杂度区域序列分析组成偏倚区域,可能导致假阳性比对Ch3 Performing a BLAST Search
397Conserved Domain Database保守结构域数据库CDD数据库NCBI CDD;正文首次可写 Conserved Domain Database(CDD)Ch3 Performing a BLAST Search
398hit listhit listBLAST 输出BLAST 输出中的命中列表;界面/输出术语保留英文Ch3 Performing a BLAST Search
399positivespositivesBLAST 输出完全匹配加保守替换;输出字段保留英文Ch3 Performing a BLAST Search
400cut-off截断标准序列分析BLAST 等搜索结果判定阈值;复数 cut-offs 同译Ch3 Suggested BLAST Cut-Offs
401twilight zone暮光区序列分析低序列一致性区域,序列关系结论通常不可靠;正文首次保留英文并加中文Ch3 Suggested BLAST Cut-Offs
402putative homology推定同源关系序列分析需结合比对和文献证据判断Ch3 Suggested BLAST Cut-Offs
BLAST 2 SequencesBLAST 2 SequencesBLAST 变体名,保留英文
local alignment局部比对序列比对术语
query sequencequery sequenceBLAST 界面/输出术语,保留英文
subject sequencesubject sequenceBLAST 界面/输出术语,保留英文
dot matrix viewdot matrix viewBLAST 2 Sequences 输出视图,保留英文
dotplotdotplot点阵图/点图;本项目保留英文
ctenophore栉水母动物类群
direct or inverted repeats正向或反向重复序列结构术语
MegaBLASTMegaBLASTBLASTN 变体名,保留英文
BLASTNBLASTN核苷酸 BLAST 程序名,保留英文
nucleotide sequence核苷酸序列序列类型
exact match精确匹配序列比对术语
greedy gapped alignment routinegreedy gapped alignment routine(贪婪式带缺口比对流程)MegaBLAST 算法描述
contigcontig组装连续序列术语,保留英文
word lengthword lengthBLAST 参数名,保留英文
non-affine gap penalty schemenon-affine gap penalty schemeBLAST 参数方案名,保留英文
discontiguous MegaBLASTdiscontiguous MegaBLASTMegaBLAST 变体名,保留英文
sequence identitysequence identity比对统计术语,保留英文
discontiguous word approachdiscontiguous word approach算法方法名,保留英文
PSI-BLASTPSI-BLASTposition-specific iterated BLAST,保留英文
position-specific iterated BLASTposition-specific iterated BLASTPSI-BLAST 全称,保留英文
position-specific scoring matrixposition-specific scoring matrix(PSSM)位置特异性打分矩阵;首次可中文解释
PSSMPSSMposition-specific scoring matrix 缩写,保留英文
hidden Markov modelhidden Markov model模型名,保留英文
profileprofilePSSM/序列模型语境,保留英文
multiple sequence alignmentmultiple sequence alignment多序列比对;本项目保留英文术语
protein family蛋白家族生物学术语
absolute sequence identity绝对 sequence identity比对统计语境
distantly related protein远缘相关蛋白同源性语境
conservative substitution保守替换序列比对术语
non-conservative substitution非保守替换序列比对术语
query protein sequencequery protein sequenceBLAST 术语,保留英文
search converges搜索收敛PSI-BLAST 迭代语境
sex-determining protein SRYsex-determining protein SRY蛋白名,保留英文
E value thresholdE value threshold参数名,保留英文
PSI-BLAST thresholdPSI-BLAST threshold参数名,保留英文
hit list tablehit list tableBLAST 输出表术语,保留英文
inclusion boxesinclusion boxes界面复选框语境,保留英文
BLATBLATBLAST-Like Alignment Tool,保留英文
BLAST-Like Alignment ToolBLAST-Like Alignment ToolBLAT 全称,保留英文
nucleotide sequence alignment program核苷酸序列比对程序工具类别
non-overlapping 11-mersnon-overlapping 11-mersBLAT 索引术语,保留英文
cross-species analyses跨物种分析比较基因组语境
Cancer Genome Anatomy ProjectCancer Genome Anatomy Project项目名,保留英文
CGAPCGAPCancer Genome Anatomy Project 缩写,保留英文
cDNA clonecDNA clone分子生物学术语,保留英文
rat genome大鼠基因组基因组语境
query pagequery page界面术语,保留英文
sequence boxsequence box界面术语,保留英文
pull-down menupull-down menu界面术语,保留英文
assemblyassembly基因组装版本语境,保留英文
query typequery type界面参数,保留英文
UCSC Genome BrowserUCSC Genome Browser数据库/浏览器名,保留英文
splice sitesplice site剪接位点;本项目界面图注语境保留英文复数 splice sites
side-by-side alignmentside-by-side alignment比对视图术语,保留英文
FASTAFASTA数据库相似性搜索程序名,保留英文
heuristic methodheuristic method算法描述,保留英文
FASTA formatFASTA format序列表示格式,保留英文
FASTX/FASTYFASTX/FASTYFASTA 算法变体,保留英文
TFASTX/TFASTYTFASTX/TFASTYFASTA 算法变体,保留英文
overlapping wordsoverlapping wordsFASTA 方法术语,保留英文
ktupktupFASTA word length 参数,保留英文
word matchword matchFASTA 搜索术语,保留英文
dotplot formatdotplot format图形表示术语,保留英文
init1init1FASTA 初始分数变量,保留英文
initninitnFASTA 连接后分数变量,保留英文
Smith-Waterman algorithmSmith-Waterman algorithm算法名,保留英文
expectation value Eexpectation value E统计显著性术语,保留英文
web front-endweb front-end网页查询前端,保留英文
gap and extension penaltiesgap and extension penalties参数名,保留英文
histone H2B.3histone H2B.3组蛋白变体名,保留英文
HydractiniaHydractinia刺胞动物属名,保留学名
Hydractinia echinataHydractinia echinata物种名,保留学名
protaminesprotamines精子 DNA 包装相关蛋白,保留英文
histogramhistogram输出图表术语,保留英文
normalized bit scorenormalized bit scoreFASTA 输出列术语,保留英文
frameshiftframeshift移码;FASTA/FASTX 输出语境保留英文复数 frameshifts
Structural Classification of ProteinsStructural Classification of Proteins数据库名,保留英文
SCOPSCOPStructural Classification of Proteins 缩写,保留英文
bioinformaticianbioinformatician生物信息学研究者;本项目复数 bioinformaticians 保留英文
black boxblack box黑箱;本项目原文引号语境保留英文
sequence-basedsequence-based以序列为基础的;本项目保留英文形容词
cross-check交叉检查/核查验证计算结果语境
403expression analysis表达分析表达分析本章总主题;指针对基因表达数据进行评估、比较与解释的分析流程Ch10 cron 2026-05-14
404gene expression profile基因表达谱表达分析指特定样本、细胞类型或条件下各基因表达水平的整体模式Ch10 cron 2026-05-14
405phenotypic state表型状态表达分析指健康、疾病或其他生物学条件下表现出的状态Ch10 cron 2026-05-14
406DNA microarrayDNA 微阵列表达分析经典高通量表达检测技术;本项目暂统一保留 DNA + 中文术语混排Ch10 cron 2026-05-14
407irreproducibility不可重复性科研方法指研究结果缺乏重复实验一致性的问题Ch10 cron 2026-05-14
408experimental design实验设计科研方法表达分析工作流的起点,决定样本、分组与重复设置Ch10 cron 2026-05-14

分类索引

按类别快速检索
▸ 基因组学 (15 条)
英文中文缩写
genome assembly基因组组装
contig重叠群contig
scaffold脚手架序列scaffold
N50N50N50
reference genome参考基因组
variant calling变异检测
SNP单核苷酸多态性SNP
indel插入缺失InDel
structural variant结构变异SV
copy number variation拷贝数变异CNV
annotation注释
gene prediction基因预测
open reading frame开放阅读框ORF
promoter启动子
enhancer增强子
▸ 工具 (9 条)
英文中文缩写
BWABurrows-Wheeler比对工具BWA
STAR剪接转录本比对工具STAR
SAMtoolsSAM格式工具集SAMtools
GATK基因组分析工具包GATK
DESeq2差异表达分析工具DESeq2
edgeR边缘R差异表达工具edgeR
SeuratSeurat单细胞分析包Seurat
ScanpyScanpy单细胞分析包Scanpy
AlphaFoldAlphaFold蛋白质结构预测AF2
▸ 序列分析 (18 条)
英文中文缩写
sequence alignment序列比对
local alignment局部比对
global alignment全局比对
pairwise alignment双序列比对
multiple sequence alignment多序列比对MSA
gap penalty空位罚分
substitution matrix替换矩阵
BLAST基本局部比对搜索工具BLAST
E-value期望值E值
bit score比特得分
query sequence查询序列
subject sequence目标序列
homology同源性
ortholog直系同源基因
paralog旁系同源基因
percent identity序列一致性百分比%ID
consensus sequence共有序列
motif序列模体motif
▸ 数据库 (6 条)
英文中文缩写
GenBankGenBank核苷酸数据库GenBank
UniProtUniProt蛋白质数据库UniProt
PDB蛋白质数据银行PDB
EnsemblEnsembl基因组数据库Ensembl
SRA序列读取存档SRA
GEO基因表达综合数据库GEO
▸ 机器学习 (7 条)
英文中文缩写
feature extraction特征提取
dimensionality reduction降维
principal component analysis主成分分析PCA
clustering聚类
classification分类
cross-validation交叉验证CV
overfitting过拟合
▸ 测序 (5 条)
英文中文缩写
read测序读段read
coverage测序深度
paired-end sequencing双端测序PE
long-read sequencing长读长测序
short-read sequencing短读长测序
▸ 深度学习 (5 条)
英文中文缩写
neural network神经网络NN
convolutional neural network卷积神经网络CNN
transformer变换器Transformer
language model语言模型LM
embedding嵌入/向量表示
▸ 系统生物学 (8 条)
英文中文缩写
gene ontology基因本体GO
GO termGO术语GO term
pathway通路
KEGG京都基因与基因组百科全书KEGG
protein-protein interaction蛋白质-蛋白质相互作用PPI
network网络
hub gene核心基因
enrichment analysis富集分析
▸ 统计 (2 条)
英文中文缩写
false discovery rate错误发现率FDR
p-valuep值p
▸ 蛋白质组学 (3 条)
英文中文缩写
proteome蛋白质组
mass spectrometry质谱MS
peptide肽/肽段
▸ 蛋白质结构 (10 条)
英文中文缩写
domain结构域
protein structure prediction蛋白质结构预测
fold蛋白质折叠
active site活性位点
binding site结合位点
secondary structure二级结构
tertiary structure三级结构
quaternary structure四级结构
homology modeling同源建模
molecular docking分子对接
▸ 表观遗传学 (7 条)
英文中文缩写
epigenome表观基因组
ChIP-seq染色质免疫沉淀测序ChIP-seq
ATAC-seq转座酶可及染色质测序ATAC-seq
DNA methylationDNA甲基化
histone modification组蛋白修饰
chromatin accessibility染色质可及性
peak calling峰值检测
▸ 转录组学 (16 条)
英文中文缩写
transcriptome转录组
RNA-seqRNA测序RNA-seq
differential expression差异表达DE
read mapping读段比对
transcript转录本
isoform异构体
alternative splicing选择性剪接
FPKM每百万映射读段中每千碱基的读段数FPKM
TPM每百万转录本中每千碱基的转录本数TPM
count matrix计数矩阵
normalization标准化
batch effect批次效应
single-cell RNA-seq单细胞RNA测序scRNA-seq
cell clustering细胞聚类
UMAP均匀流形近似与投影UMAP
t-SNEt-分布随机近邻嵌入t-SNE

翻译规范

生物信息学教材翻译规范 & 常见错误
规则说明正确示例错误示例
基因名保留英文人类基因名用斜体大写,不翻译TP53 基因肿瘤蛋白53基因
物种学名保留斜体拉丁文二名法,不翻译Homo sapiens智人(学名处)
数据库名保留英文NCBI、UniProt、PDB 等不翻译UniProt 数据库单一蛋白数据库
软件/工具名保留BLAST、BWA、Seurat 等不翻译使用 BLAST 进行搜索使用基本局部比对工具搜索
统计术语精确p-value 不等于假设成立的概率p < 0.05概率小于0.05
homology≠similarity同源性指共同祖先,相似性指序列相似同源蛋白相似蛋白(当有共同祖先时)
alignment 的翻译序列语境下译'比对',结构语境下可译'叠合'序列比对结果序列排列/对齐
assembly 的翻译基因组语境下译'组装',其他勿混基因组组装基因组构建
read 保留英文测序读段,避免译为'读数'测序 read 长度读数长度
coverage 的翻译测序语境:测序深度;基因组覆盖率两义,需注明10× 测序深度10× 覆盖
公式/代码不翻译LaTeX 公式、代码块、序列数据原样保留```python def align():```翻译代码注释时保留代码
缩写首次出现展开首次出现给出全称+缩写,后续可直接用缩写单核苷酸多态性(SNP)SNP(不给全称)

Prompt片段

可直接复制到翻译 Prompt 的术语对照(按类别分块)
## 基因组学
genome assembly → 基因组组装 contig → 重叠群 (contig) scaffold → 脚手架序列 (scaffold) N50 → N50 (N50) reference genome → 参考基因组 variant calling → 变异检测 SNP → 单核苷酸多态性 (SNP) indel → 插入缺失 (InDel) structural variant → 结构变异 (SV) copy number variation → 拷贝数变异 (CNV) annotation → 注释 gene prediction → 基因预测 open reading frame → 开放阅读框 (ORF) promoter → 启动子 enhancer → 增强子
## 工具
BWA → Burrows-Wheeler比对工具 (BWA) STAR → 剪接转录本比对工具 (STAR) SAMtools → SAM格式工具集 (SAMtools) GATK → 基因组分析工具包 (GATK) DESeq2 → 差异表达分析工具 (DESeq2) edgeR → 边缘R差异表达工具 (edgeR) Seurat → Seurat单细胞分析包 (Seurat) Scanpy → Scanpy单细胞分析包 (Scanpy) AlphaFold → AlphaFold蛋白质结构预测 (AF2)
## 序列分析
sequence alignment → 序列比对 local alignment → 局部比对 global alignment → 全局比对 pairwise alignment → 双序列比对 multiple sequence alignment → 多序列比对 (MSA) gap penalty → 空位罚分 substitution matrix → 替换矩阵 BLAST → 基本局部比对搜索工具 (BLAST) E-value → 期望值 (E值) bit score → 比特得分 query sequence → 查询序列 subject sequence → 目标序列 homology → 同源性 ortholog → 直系同源基因 paralog → 旁系同源基因 percent identity → 序列一致性百分比 (%ID) consensus sequence → 共有序列 motif → 序列模体 (motif)
## 数据库
GenBank → GenBank核苷酸数据库 (GenBank) UniProt → UniProt蛋白质数据库 (UniProt) PDB → 蛋白质数据银行 (PDB) Ensembl → Ensembl基因组数据库 (Ensembl) SRA → 序列读取存档 (SRA) GEO → 基因表达综合数据库 (GEO)
## 机器学习
feature extraction → 特征提取 dimensionality reduction → 降维 principal component analysis → 主成分分析 (PCA) clustering → 聚类 classification → 分类 cross-validation → 交叉验证 (CV) overfitting → 过拟合
## 测序
read → 测序读段 (read) coverage → 测序深度 paired-end sequencing → 双端测序 (PE) long-read sequencing → 长读长测序 short-read sequencing → 短读长测序
## 深度学习
neural network → 神经网络 (NN) convolutional neural network → 卷积神经网络 (CNN) transformer → 变换器 (Transformer) language model → 语言模型 (LM) embedding → 嵌入/向量表示
## 系统生物学
gene ontology → 基因本体 (GO) GO term → GO术语 (GO term) pathway → 通路 KEGG → 京都基因与基因组百科全书 (KEGG) protein-protein interaction → 蛋白质-蛋白质相互作用 (PPI) network → 网络 hub gene → 核心基因 enrichment analysis → 富集分析
## 统计
false discovery rate → 错误发现率 (FDR) p-value → p值 (p)
## 蛋白质组学
proteome → 蛋白质组 mass spectrometry → 质谱 (MS) peptide → 肽/肽段
## 蛋白质结构
domain → 结构域 protein structure prediction → 蛋白质结构预测 fold → 蛋白质折叠 active site → 活性位点 binding site → 结合位点 secondary structure → 二级结构 tertiary structure → 三级结构 quaternary structure → 四级结构 homology modeling → 同源建模 molecular docking → 分子对接
## 表观遗传学
epigenome → 表观基因组 ChIP-seq → 染色质免疫沉淀测序 (ChIP-seq) ATAC-seq → 转座酶可及染色质测序 (ATAC-seq) DNA methylation → DNA甲基化 histone modification → 组蛋白修饰 chromatin accessibility → 染色质可及性 peak calling → 峰值检测
## 转录组学
transcriptome → 转录组 RNA-seq → RNA测序 (RNA-seq) differential expression → 差异表达 (DE) read mapping → 读段比对 transcript → 转录本 isoform → 异构体 alternative splicing → 选择性剪接 FPKM → 每百万映射读段中每千碱基的读段数 (FPKM) TPM → 每百万转录本中每千碱基的转录本数 (TPM) count matrix → 计数矩阵 normalization → 标准化 batch effect → 批次效应 single-cell RNA-seq → 单细胞RNA测序 (scRNA-seq) cell clustering → 细胞聚类 UMAP → 均匀流形近似与投影 (UMAP) t-SNE → t-分布随机近邻嵌入 (t-SNE)