广州番禺Python, Java小班周末班培训
薯条老师在广州做Python和Java的小班培训,一个班最多10人,学员的平均就业薪资有11K。不在广州的同学可以报名线上直播班,跟线下小班的同学们同步学习。培训的课程有Python爬虫,Python后端开发,Python办公自动化,Python大数据分析,Python量化投资,Python机器学习,Java中高级后端开发。授课详情请点击:http://chipscoco.com/?cate=6
12.5.1 什么是字典树?
字典树又称单词查找树,Trie树,是一种树形结构。字典树的三个基本性质:
(1) 根节点不包含字符,除根节点外每一个节点都只包含一个字符;
(2) 从根节点到某一节点,路径上经过的字符连接起来,为该节点对应的字符串;
(3) 每个节点的所有子节点包含的字符都不相同
下图所示的结构就是字典树:
上图中的root表示根节点,红色的节点表示从根节点到该节点路径的所有字符构成一个完整的单词。比如图中的王八就是一个单词,王子文就是一个单词。王八和王子文有一个共同的前缀:王。这也是为什么使用字典树可以查找共同前缀。
12.5.2 字典树实现及使用场景
我们现在利用Python中的字典来构造这棵字典树:
""" @author: 薯条老师 @desc: 实现字典树结构 """ names = ["王八", "王子文", "李唐"] trie = {"root": {}} for name in names: prev = trie_next = trie["root"] for ch in name: if ch not in trie_next: trie_next[ch] = {} prev = trie_next trie_next = trie_next[ch] else: # 键值为0的节点即为红色节点 prev[ch] = 0 print(trie)
字典树常用于字符串检索,以及查找字符串的公共前缀等。我们现在根据字典树结构,来写一个识别文本中的敏感词算法。Python代码如下:
""" @author: 薯条老师 @desc: 根据字典树来识别文本中的敏感词 """ # 定义敏感词列表,后续根据该列表来构造字典树 sensitive_words = ["他妈的", "你妹"] trie = {"root": {}} for sensitive_word in sensitive_words: prev = trie_next = trie["root"] for ch in sensitive_word: if ch not in trie_next: trie_next[ch] = {} prev = trie_next trie_next = trie_next[ch] else: prev[ch] = 0 # text系用户在某论坛发表的一些评论 text = "我跟他妈在街上偶遇,没想到被你妹妹看到了" length_of_text = len(text) for index in range(length_of_text): pos = index sensitive_word = "" trie_next = trie["root"] while text[pos] in trie_next and pos < length_of_text: sensitive_word += text[pos] trie_next = trie_next[text[pos]] if trie_next == 0: print(f"发现了敏感词汇{sensitive_word}") break pos += 1
12.5.3 最具实力的小班培训
薯条老师在广州做Python和Java的小班培训,一个班最多10人。不在广州的同学可以报名线上直播班,跟线下小班的同学们同步学习。打算参加小班培训的同学,必须遵守薯条老师的学习安排,认真做作业和项目。把知识学好,学扎实,那么找到一份高薪的工作就是很简单的一件事。
(1) Python后端工程师高薪就业班,月薪11K-18K,免费领取课程大纲
(2) Python爬虫工程师高薪就业班,年薪十五万,免费领取课程大纲
(3) Java后端开发工程师高薪就业班,月薪11K-20K, 免费领取课程大纲
(4) Python大数据分析,量化投资就业班,月薪12K-25K,免费领取课程大纲
扫码免费领取Python学习资料: