这个问题已经在这里有一个答案:
- Python的re.search 2个回答
我试图从解决问题这个Hackerrank 。 这是一个机器学习问题。 起初,我试图读取所有从语料库文件中的单词构建的单字组频率。 根据这一ML问题word
被定义为
字是含有仅字母字符序列
a
到z
(小写只),并且可以包含连字符(-
和撇号('
)。 Word应开始,只用小写字母结束。
我喜欢这条巨蟒写了一个正则表达式:
pat = "[a-z]+( ['-]+[a-z]+ ){0,}"
我试图同时使用re.search()
和re.findall()
我有两个问题。
问题
re.findall()
string = "HELLO WORLD"
的输出
re.findall()
[('Hello', ''), ('W', '-D')]
我不能让这个词
WORLD
。 虽然使用re.search()
我是能够正确地得到它问题
re.search()
string = "123hello456world789"
的输出
re.search()
'hello'
在这种情况下,当使用
re.findall()
我能得到这两个'hello'
和'world'
。