題意:給你一個長度爲n序列,和一個數m,問這個序列有多少個子序列,知足這個子序列的全部子序列的和是m的倍數?答案對1e9 + 7取模,n, m範圍到5e3;c++
思路:容易發現,若是一個子序列的長度是n,子序列的全部的元素的和是sum的話,它的全部的子序列的和是sum * 2 ^ (n - 1),那麼咱們發現,一個序列的全部子序列的和與子序列的和以及子序列的長度有關,咱們容易想O(n^2 * m)的DP。設dp[i][j][k]爲前i個數,長度爲j的子序列中子序列的和是k的元素的個數。每掃到一個新的元素,有兩種決策:1:不加這個數dp[i + 1][j][k] += dp[i][j][k];2:加這個數dp[i + 1][j +1][k + a[i + 1] += dp[i][j][k]。每次轉移O(n * m),總複雜度O(n ^ 2 * m).優化
咱們如今考慮優化一下dp。咱們發現一個序列的子序和與2 ^ (n - 1)與sum有關,若要子序和是m的倍數,分兩種狀況:1:2不是m的因子,那麼容易發現2 ^ (n - 1)不會影響子序和是不是m的倍數。2:2是m的因子,可是m最大範圍是5e3,因此最大有2 ^ 12這個因子,而因此當n大於12的時候又變成了狀況1.因此,實際上dp的第二維的大小隻有十幾,複雜度降爲了O(n * logn * m),可是這樣的複雜度仍然不夠優秀,咱們考慮繼續優化。咱們能夠發現,dp[i][j][k]中,隨着j的增長,k那一維的模數也在不斷減小,模數是m + m / 2 + m / 4 ...這個複雜度是O(m)的,因此咱們逐步優化以後,複雜度下降到了O(n * m)。spa
代碼:blog
#include <bits/stdc++.h> #define LL long long using namespace std; const int maxn = 5010; const LL mod = 1000000007; int a[maxn], dp[2][15][maxn], p[20]; void update(int &x, int y) { x = ((long long)x + y) % mod; } int main() { int n, m; int ans = 0; scanf("%d%d", &n, &m); for (int i = 1; i <= n; i++) { scanf("%d", &a[i]); } int cnt = 0; int tmp = m; while(tmp % 2 == 0) { tmp /= 2; cnt++; } dp[0][0][0] = 1; for (int i = 0; i < n; i++) { memset(dp[(i + 1) & 1], 0, sizeof(dp[(i + 1) & 1])); for (int j = 0; j <= cnt + 1; j++) { memset(dp[(i + 1) & 1][j], 0, sizeof(int) * (m / (1 << max(0, j - 1)))); } for (int j = 0; j <= cnt; j++) { int mm = m / (1 << max(0, j - 1)), mmm = m / (1 << max(0, j)); for (int k = 0; k < mm; k++) { if(!dp[i & 1][j][k]) continue; update(dp[(i + 1) & 1][j][k], dp[i & 1][j][k]); update(dp[(i + 1) & 1][j + 1][(k + a[i + 1]) % mmm], dp[i & 1][j][k]); } } for (int j = 0; j < tmp; j++) { if(!dp[i & 1][cnt + 1][j]) continue; update(dp[(i + 1) & 1][cnt + 1][j], dp[i & 1][cnt + 1][j]); update(dp[(i + 1) & 1][cnt + 1][(j + a[i + 1]) % tmp], dp[i & 1][cnt + 1][j]); } } for (int i = 1; i <= cnt + 1; i++) { update(ans, dp[n & 1][i][0]); } printf("%d\n", ans); return 0; }