当前位置:首页 > 比赛题解 > NOIP2023词典问题终极指南:从字符频率统计到字典序比较的完整解析 | 算法竞赛必备技能

NOIP2023词典问题终极指南:从字符频率统计到字典序比较的完整解析 | 算法竞赛必备技能

4天前比赛题解55

截图未命名.jpg NOIP2023词典问题终极指南:从字符频率统计到字典序比较的完整解析 | 算法竞赛必备技能 NOIP2023 词典问题 字典序比较 字符频率统计 算法优化 第1张

一、问题理解与算法思路

词典问题要求判断每个单词是否存在一种排列方式,使其字典序严格小于其他所有单词的所有可能排列。核心思路是通过预处理每个单词的最小和最大字典序排列,然后进行高效比较。

关键算法步骤

  1. 预处理每个单词的字符频率

  2. 生成最小和最大字典序排列

  3. 并行比较所有单词的边界情况

二、完整代码实现(带详细注释)

#include <iostream>
#include <vector>
#include <algorithm>
using namespACe std;

int main() {
    ios::sync_with_stdio(false);  // 关闭同步提升IO速度
    cin.tie(nullptr);             // 解除cin和cout的绑定
    
    int n, m;  // n:单词数量 m:单词长度(题目未实际使用)
    cin >> n >> m;
    vector<string> words(n);  // 存储所有单词
    // 使用short类型节省空间,存储每个单词的字符频率
    vector<vector<short>> min_chars(n, vector<short>(26, 0));
    vector<vector<short>> max_chars(n, vector<short>(26, 0));
    
    // 预处理字符频率统计
    for (int i = 0; i < n; ++i) {
        cin >> words[i];
        for (char c : words[i]) {
            min_chars[i][c - 'a']++;  // 统计字符出现次数
            max_chars[i][c - 'a']++;  // 两个数组初始相同
        }
    }
    
    // 预处理生成最小和最大字典序单词
    vector<string> min_words(n), max_words(n);
    for (int i = 0; i < n; ++i) {
        // 构建最小字典序:字母升序排列
        for (int c = 0; c < 26; ++c) {
            min_words[i] += string(min_chars[i][c], 'a' + c);
        }
        // 构建最大字典序:字母降序排列
        for (int c = 25; c >= 0; --c) {
            max_words[i] += string(max_chars[i][c], 'a' + c);
        }
    }
    
    string result(n, '0');  // 初始化结果字符串
    if (n == 1) {  // 特殊处理只有一个单词的情况
        cout << "1\n";
        return 0;
    }
    
    // 并行比较优化:检查每个单词的最小字典序是否小于其他所有单词的最大字典序
    for (int i = 0; i < n; ++i) {
        bool valid = true;
        for (int j = 0; j < n; ++j) {
            if (i == j) continue;  // 不和自己比较
            if (min_words[i] >= max_words[j]) {  // 字典序比较
                valid = false;
                break;
            }
        }
        result[i] = valid ? '1' : '0';  // 设置结果位
    }
    
    cout << result << '\n';  // 输出结果
    return 0;
}

三、算法核心解析

  1. 字符频率统计:使用两个26长度的数组记录每个字母出现次数

  2. 字典序边界生成

    • 最小字典序:字母升序排列(a-z)

    • 最大字典序:字母降序排列(z-a)

  3. 并行比较优化:通过边界比较避免枚举所有排列组合

四、复杂度分析与优化

  1. 时间复杂度:O(n^2 * m),其中n是单词数,m是单词长度

  2. 空间优化:使用short类型存储字符频率

  3. IO优化:使用ios::sync_with_stdio加速输入输出

五、常见问题解答

Q:为什么要生成最小和最大字典序? A:这样可以通过边界比较确定是否存在满足条件的排列,避免检查所有可能排列。

Q:如何处理特殊字符或大写字母? A:题目限定小写字母,实际应用中可扩展ASCII码范围。

Q:算法是否可以进一步优化? A:可以尝试使用字典树(Trie)或更高效的数据结构优化比较过程。


原创内容 转载请注明出处

分享给朋友:

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。