LLMs的母语————Markdown和LaTex语法简介

学着使用md和latex,顺便听听泡面的废话

Posted by Pomix on October 21, 2025

本文是尚在编写中的DeepStudent使用文档的另一部分,泡面还在很努力地写。

DeepStudent使用的md和latex语法上与其他地方的没有什么区别,公式使用$包裹。这里是纯粹的科普文,面向对ai会话了解较少的用户。若您有相应知识基础可以直接略过。

相信你在理科学习的过程中经常见到试卷上、资料中有这样那样的公式,它们用和常规文字不一样的字体渲染、有着这样那样的上下标和符号,但是,你也许把手机和电脑的输入法里那些符号表都翻冒烟了,也没能找出完美写出一样的公式的办法。另外,你也许在各种AI对话软件里边也看到过这些公式,还有随时出现的粗体斜体、表格、代码块等等美观的内容呈现,但当你按下消息下方的复制,将它们挪到其他地方的时候,它们有时却会变成带有许多*、#、-等符号,\frac、\sqrt等等冗长的字符串。这是怎么一回事?

其实,这就是LLM——也就是Large Language Model大语言模型,现在最火最热的Ai——的“母语”。顾名思义,LLM是主要处理文本信息的模型。要想让它们输入输出这样那样公式、使用文档功能,就需要把这些复杂的东西用简单、结构化的文本表达出来。于是,训练LLM的工程师们选择了Markdown语法作为LLMs的日常用语规范。它是一种轻量化的标记语言,可以用*#这些简单的符号来控制多级标题、粗体斜体删除线线、表格和代码块等等内容。(也就是说,用这些星号、井号等符号作为其他文本的标记,告诉软件这里要把文本渲染成什么效果)它在自然语言为主、结构化文本为辅的文档中相当常用,不仅对人类和程序都比较友好,而且还能轻松地渲染成网页。(悄悄说一句,你现在看到的阑夜Site(pomix.icu)的推文就是用Markdown编写的哦)。

而Markdown语法中具有对LaTex语法的支持,LaTex是我们在各类文档中写数理化公式时常用的语法,程序可以从纯粹的文本中渲染出那些上下标和各种符号。通常你只需要在Markdown文档中打出$$并把公式加在里面就可以使用LaTex语法编辑公式。

接下来,我们来简单介绍一下这两种语法的用法。


标题功能:文本格式如# 文本顶格出现代表标题,井号的数量越多、标题层级越低、字号相对越小。例如这样:

1
2
3
4
5
6
# 一级标题
## 二级标题
### 三级标题
#### 四级标题
##### 五级标题
###### 六级标题

我是一级标题

我是二级标题

我是三级标题

大部分使用markdown语法的程序通常会支持至少三级的标题,当然也常常有四、五、六级标题出现。


粗体、斜体、删除线:用两个星号或者下划线包裹文本是粗体我是粗体文字,一个星号或者下划线包裹文本是斜体我是斜体文字,一个波浪线包裹文本是删除线 我被划掉了 ,这些功能可以自由组合我是一段被划掉的加粗斜体文字

分点陈述:在行首打一个-,就可以得到一个小圆点。

  • 我是第一项东西

  • 我是第二项东西

有序列表:用1.2.3.

  1. 第一个步骤
  2. 第二个步骤

待办清单:在行首打一个- [ ]可以得到一个框框,把中括号里面的空格换成x就可以打勾。

  • 我是一件还没做的事

  • 我是一件做完了的事

各种分割线:独立成行的三个星号、三个横杠,效果相同。(放在行内会触发加粗斜体)


文本块和代码块:一个`包裹行内代码块块,三个加语言名包裹独立代码块,不加语言名会产生text文本块。

我是文本块

1
print ('HelloDstu') #这是一串Python代码,包裹方法是```python[你的代码]```

表格:大体上这样用

表头1 表头2 表头3
内容1 内容2 内容3
左对齐 居中 右对齐
1
2
3
4
5
6
7
| 表头1 | 表头2 | 表头3 |
|-------|-------|-------|
| 内容1 | 内容2 | 内容3 |
| 左对齐 | 居中 | 右对齐 |
左对齐: |:---|
居中: |:---:|
右对齐: |---:|

插入超链接和图片

1
2
[链接文字](https://example.com)
![图片描述](图片地址)

转义字符:用反斜杠来标记星号和其他符号,防止程序认为你想用黑体等。

*这不是斜体*

1
\*这不是斜体\*

脚注:

1
2
3
这是一个带有脚注的句子[^1]。

[^1]: 这里是脚注内容。

接下来我们介绍与Markdown和数理化相关的语法。

1
2
3
4
在md文档中,$把文字塞进美元符号里可以产生行内公式$
$$
打两个美元符号再回车可以触发公式块,再用两个美元符号封闭。
$$

这是一个行内公式:$y=kx+b$

这是公式块:

\[e=1.6\times10^{-19}C\]

LaTex的核心思想是指令+文本,例如打出\frac{3}{2},表示的是$\frac32$,其中\frac就是指令,代表分式(fraction),而两个大括号里的内容就是分数线上和分数线下的文本。这里的文本不只是简单的数字和字母,你还可以继续嵌套指令和文本,混合出复杂的公式,例如\frac{\sqrt{3}}{2}就是$\frac{\sqrt3}2$。不过,这里有两个习惯需要注意:一是一般来说在文本块只有一个字符的时候可以不加大括号,但是像\sqrt这样的指令不能直接跟其他的字母,否则程序会认为你输入了错误的指令,因此泡面推荐把大括号打全一些,使得潜在的错误更少;二是你的输入法中可能会有乘除这些符号,系统可以正常渲染它们,甚至于你渲染LaTex代码的程序也可以正常渲染它们,但是这些符号和LaTex内置的符号是两个东西,为了更高的兼容性最好不要用你输入法自带的符号。尤其是在一些外国软件上,你更需要注意保证自己输入的是标准的ASCII字符没有中文和更多的特殊符号,要不然这可能会给你造成巨大的麻烦

学完了LaTex的基本用法之后,剩下的就是了解必要的指令和符号的写法了。这里有常用指令和各个希腊字母的表格:

类别 名称/描述 LaTeX 代码 渲染结果示例
基础与符号 上标 x^2, e^{x+y} $x^2, e^{x+y}$
  下标 a_1, x_{ij} $a_1, x_{ij}$
  分数 \frac{a}{b}, \dfrac{a}{b} $\frac{a}{b}, \dfrac{a}{b}$
  平方根 \sqrt{x} $\sqrt{x}$
  n次方根 \sqrt[n]{x} $\sqrt[n]{x}$
  普通点(乘法) \cdot $\cdot$
  省略号(居中) \cdots $\cdots$
  省略号(底部) \ldots $\ldots$
  无穷大 \infty $\infty$
  偏微分符号 \partial $\partial$
  微分算子 \mathrm{d} $\mathrm{d}$
希腊字母 Alpha / Beta \alpha, \beta $\alpha, \beta$
  Gamma / Delta \Gamma, \Delta $\Gamma, \Delta$
  Pi / Omega \Pi, \Omega $\Pi, \Omega$
  Theta / Sigma \theta, \Sigma $\theta, \Sigma$
  Phi (φ / ϕ) \phi, \varphi $\phi, \varphi$
  Epsilon (ε / ϵ) \epsilon, \varepsilon $\epsilon, \varepsilon$
运算符 加减乘除 +, -, \times, \div $+, -, \times, \div$
  正负号 \pm, \mp $\pm, \mp$
  不等号 \ne, \approx, \equiv $\ne, \approx, \equiv$
  比较符 \le, \ge, \ll, \gg $\le, \ge, \ll, \gg$
  箭头 \to, \implies, \iff $\to, \implies, \iff$
  极限 \lim_{x \to a} f(x) $\lim_{x \to a} f(x)$
  求和 \sum_{i=1}^{n} i^2 $\sum_{i=1}^{n} i^2$
  求积 \prod_{i=1}^{n} i $\prod_{i=1}^{n} i$
  积分 \int_{a}^{b} f(x) \, dx $\int_{a}^{b} f(x) \, dx$
  二重/曲面积分 \iint, \oint $\iint, \oint$
括号与定界符 自适应圆括号 \left( \frac{a}{b} \right) $\left( \frac{a}{b} \right)$
  自适应方括号 \left[ \frac{a}{b} \right] $\left[ \frac{a}{b} \right]$
  自适应花括号 \left\{ \frac{a}{b} \right\} $\left{ \frac{a}{b} \right}$
  绝对值/范数 \lvert x \rvert, \lVert v \rVert $\lvert x \rvert, \lVert v \rVert$
函数名 三角函数 \sin x, \cos x, \tan x $\sin x, \cos x, \tan x$
  对数函数 \log x, \ln x, \lg x $\log x, \ln x, \lg x$
  极限/最大最小 \lim, \max, \min, \sup, \inf $\lim, \max, \min, \sup, \inf$
箭头与关系 向量箭头 \vec{v}, \overrightarrow{AB} $\vec{v}, \overrightarrow{AB}$
  双向箭头 \leftrightarrow, \Leftrightarrow $\leftrightarrow, \Leftrightarrow$
  推导箭头 \Rightarrow, \Longrightarrow $\Rightarrow, \Longrightarrow$
矩阵与方程组 矩阵(方括号) \begin{bmatrix} a & b \\ c & d \end{bmatrix} $\begin{bmatrix} a & b \ c & d \end{bmatrix}$
  矩阵(圆括号) \begin{pmatrix} a & b \\ c & d \end{pmatrix} $\begin{pmatrix} a & b \ c & d \end{pmatrix}$
  行列式 \begin{vmatrix} a & b \\ c & d \end{vmatrix} $\begin{vmatrix} a & b \ c & d \end{vmatrix}$
  条件方程组 \begin{cases} x + y = 1 \\ x - y = 0 \end{cases} $\begin{cases} x + y = 1 \ x - y = 0 \end{cases}$
化学式 上标(电荷) H^+, SO_4^{2-} $H^+, SO_4^{2-}$
  反应箭头 \to, \longrightarrow, \rightleftharpoons $\to, \longrightarrow, \rightleftharpoons$
  气体/沉淀符号 \uparrow, \downarrow (需文本模式) $\uparrow, \downarrow$ (需文本模式)
  化学键 \ce{C6H5-CHO} (需mhchem宏包) (需mhchem宏包支持)

字母名称 大写 LaTeX 代码 (大写) 小写 LaTeX 代码 (小写) 中文音译 (常规)
Alpha A A α \alpha 阿尔法
Beta B B β \beta 贝塔
Gamma Γ \Gamma γ \gamma 伽马
Delta Δ \Delta δ \delta 德尔塔
Epsilon E E ϵ / ε \epsilon / \varepsilon 艾普西龙
Zeta Z Z ζ \zeta 泽塔
Eta H H η \eta 伊塔
Theta Θ \Theta θ / ϑ \theta / \vartheta 西塔
Iota I I ι \iota 约塔
Kappa K K κ / ϰ \kappa / \varkappa 卡帕
Lambda Λ \Lambda λ \lambda 兰布达
Mu M M μ \mu
Nu N N ν \nu
Xi Ξ \Xi ξ \xi 克西
Omicron O O ο o 奥密克戎
Pi Π \Pi π / ϖ \pi / \varpi
Rho P P ρ / ϱ \rho / \varrho
Sigma Σ \Sigma σ / ς \sigma / \varsigma 西格玛
Tau T T τ \tau
Upsilon Υ \Upsilon υ \upsilon 宇普西龙
Phi Φ \Phi ϕ / φ \phi / \varphi
Chi X X χ \chi
Psi Ψ \Psi ψ \psi 普西
Omega Ω \Omega ω \omega 奥米伽

到此,你就基本了解了这两种语法的用法,只要在需要时查一查资料就可以打出合适的公式。随着时间的推移和你使用它们次数的增加,你会变得越发熟练,最终在文档编辑中可以优雅地只靠键盘手搓公式和重点突出、图文并茂的文档。如果你还有什么不甚清楚的部分,或是想了解这篇文档没有讲到的地方,你可以直接把问题抛给LLMs,它们最熟悉这些语法了。


后记:LLM王朝降临之后,泡面在某书、某盒之类的图文资讯平台上边经常会看到一些标题很有噱头的资讯。点进去一看,里面却满是*#都不删的文字,哪怕内容是简单的文本,仔细一看却词藻华丽旁征博引得过了度,有一种很强的非人感。(尤其是之前ChatGPT爆火和今年DeepSeek-R1一炮而红的时期)于是,泡面仿佛患上了一种大病:一看到一串文本,首先就要检查一下是不是md语法,再看看遣词造句,鉴定一下文本是不是由ai生成的。如果是便要马上捏着鼻子划走甚至勃然大怒:泡面废了老鼻子劲把自己接入互联网是来看这些ai语料的?还有人类吗?

很可惜的是,纯粹的情绪发泄并没有什么用处,事实是ai(主要是LLMs,还有各位视频和图像模型)就是大规模地在世界范围内攻城略地,渗透到我们生活的方方面面。从资讯软件上的新闻到电商平台的配图,从文字里的插画到某音某手某站的ai视频,它们(或者祂们)已经无孔不入。至于您现在看到的DeepStudent,那更是LLMs进军教育界的一大例证了。

这不好笑。ai的广泛运用固然有其提高各个系统的运行效率的作用,但很多时候我们在做的另一件事是——拿几分几秒之内快速生成的东西来互相敷衍。于是乎文字和图像背后,泡面再也看不到一个真正的人。

几年前读《数字化生存》的时候泡面看到,由人类产出的作品可能会被贴上标签,当成奢侈品售卖(大概是这个意思,原文快忘光了)。当时泡面还想:没那么炸裂吧?没想到,这一天来得如此之快。

人类没有为上一个时代哀悼,大家都ALL IN AI了,泡面也是。尽管泡面勉勉强强算得上是数字世界一代半的原住民,还在密切关注着这个领域的发展甚至干脆投身于此,但是看到人和人之间隔上一层又一层可悲的厚障壁还是会本能地胆寒。

在它们占领世界之前或之后,泡面还是想能真切地触碰你。