两列根据相同字符占比，按照相似度模糊匹配的问题

显示全部楼层 · 2021-2-18 22:14:09

两列根据相同字符占比，按照相似度模糊匹配，按照最相似的为同一行。
Power Query如何做查询？

11023111747331.rar (48.1 KB, 下载次数: 0)

shiming · 2021-2-18 22:20:09

比较sheet1、sheet2的J列

原始宝宝 · 2021-2-18 22:26:10

总体来说，用Power Query实现并不难，但对于大多数情况下，用相同字数的多少来匹配的效果并不是很好，但你这个也许可以试试，可以参考我的这篇小文章：
杂乱文本按”相似度“进行匹配

ldm1221 · 2021-2-18 22:31:10

Power Query貌似没成功，请问哪个环节出错了？

11023111747332.rar (59.75 KB, 下载次数: 0)

osp · 2021-2-18 22:35:10

Power Query貌似没成功，请问哪个环节出错了？

对两表做合并不是添加索引列并用索引列做匹配，而是建一个内容都是“1”（或任何字符）的自定义列做匹配（或参考我另一篇文章：构建两表全部组合的极简方法）。

monkeyking · 2021-2-18 22:39:10

我仔细看了你做的步骤，大概有以下两个方面的问题：

我在你做的查询基础上修改了一下，详细请看附件。

11023111747333.rar (62.64 KB, 下载次数: 0)

liruotong · 2021-2-18 22:44:11

List.Count([交叉])/List.Average({List.Count([原名称]),List.Count([对比名称])}),Average匹配最佳。附件打开后第一次刷新报错，但是在查询编辑器中刷新均不报错，隐私设置已检查！不知为何？？？

11023111747334.rar (22.05 KB, 下载次数: 0)

xprimer · 2021-4-24 17:50:43

我也来支持一下，很喜欢这里老师

jylt2004 · 2021-5-5 11:04:59

加油站加油

文文 · 2021-6-12 11:14:32

顶顶更健康

[已解决] 两列根据相同字符占比，按照相似度模糊匹配的问题