自动化UI测试中的不可见字符问题

在自动化UI测试的过程中，我们经常需要对从用户界面获取的字符串进行断言。然而，这个流程可能会因为一些特殊的、不可见的字符而变得复杂。一个常见的例子就是HTML中的非换行空格（NBSP）。在用户界面上，这些字符可能是不可见的，但在HTML源代码或者测试的断言中，却可能会导致测试失败。失败后测试人员很难第一时间发现问题原因，因为这个字符在打印时显示为空白，查阅日志也无法发现异常。本文将讨论这个问题，以及如何在Python语言中解决这个问题。

不可见字符

在HTML中，NBSP是一种常见的特殊字符，用于控制文本的换行行为。尽管这种字符在前端页面上不显示，但在HTML源代码中，它是可见的。这可能会导致测试用例无法通过，因为预期的字符串和实际的字符串之间有着这种不可见的差异。这样的问题并不仅仅局限于NBSP，还可能包括其他的一些特殊字符，比如制表符（TAB）、换行符（LF）等等。更重要的是，NBSP与普通空格在HTML中的渲染行为不同，这可能导致潜在的页面布局问题。

如何在Python中处理这些字符

Python提供了一些工具，可以帮助我们处理这些不可见字符。例如，我们可以使用repr()函数，来获取一个对象的字符串表示。这个函数会将字符串中的所有特殊字符，包括NBSP，以转义序列的形式打印出来。

print(repr(your_string))

通过这种方式，NBSP被打印出来，显示为\xa0，我们就可以清楚地看到字符串中的所有内容，包括那些在常规情况下看不见的特殊字符。

Andy Blog